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* 1x DSP 开发 系统 


本 章 介绍 了 几 种 数字 信号 处 理 (DSP ) 开 发 工具 , 包括 最 常用 的 程序 代码 编辑 调试 软件 ( CCS ) 
和 DSP 初学 者 工具 包 (DSK )。CCS 提供 了 集成 开发 环境 (IDE ), 而 DSK 电路 板 上 有 TMS320C6711 
浮 点 处 理 器 ， 能 完全 支持 电路 系统 输 人 输出 信号 。 Ash, M DSK 还 附带 了 三 个 测试 软件 和 辜 件 
程序 实例 。 通 过 本 章 的 学 习 ， 要 学 会 使 用 ccs, ~ TACEN DSK; 并 学 会 使 用 它们 和 程序 实例 
来 测试 软 硬 件 工具 。 —— 


11 引言 


数字 信号 处 理 器 ， 如 TMS320C6x ( C6x ) 系列 处 理 器 ， 和 高 速 专用 徽 处 理 器 一 样 ， 具 有 适合 
于 信和 号 处 理应 用 的 特殊 结构 和 指令 集 。C6x 用 来 表示 德州 仪器 公司 ( TE AVE] ) TMS320C6000 系 
FPS iA SAP HERE C6x BFE ERE EA TEE BEE Cox 基于 超 长 
指令 字 (VLIW) 结构 ， 被 认为 是 可 公司 运算 能 力 最 强 的 名 再 吕 之 一 。 

数字 信号 处 理 器 具有 广泛 的 应 用 , 从 和 通信 、 控 制 到 语音 、 图 像 处 理 等 场合 都 可 以 看 到 DSP 的 
影子 ， 在 蜂窝 移动 电话 、 传 真 机 、 调 制 解 调 器 、 磁 盘 驱动 器 、 收 音 机 等 设备 中 ， 都 可 以 发 现 有 
DSP 的 应 用 。 由 于 这 些 处 理 器 具有 较 高 的 性 价 比 ， 因此 已 被 广泛 应 用 于 消费 类 产品 中 。 另 一 方面 ， 
处 理 器 能 很 方便 地 重新 编程 以 适应 不 同 的 应 用 要 求 ， 因 此 它们 能 够 处 理 不 同 的 任务 。 此 外 由 于 软 
件 和 硬件 开发 支持 成 本 较 低 ， 因 此 DSP BRET RARE. 例如 利用 DSP 技术 ， 调 制 解 调 
器 和 语音 识别 的 成 本 就 可 能 非常 便宜 。 2 

DSP 处 理 器 主 蓝 应 用 于 实时 信 生 处 理 。 实时 信 号 处 理 意 夺 着 处 到 过 各 必须 与 外 部 事件 保持 同 
步 ,而 非 实时 信号 处 理 就 不 会 有 这 样 的 限制 。 需要 实时 处 理 的 外 部 事件 一 般 是 模拟 信号 。 尽管 由 电 
明 等 分 立 电 子 元 件 组 成 的 模拟 系统 对 温度 变化 特别 敏感 ， {E DSP 系统 受 外 舞 环 境 (如 温度 等 ) 的 
影响 却 很 小 。 DSP 处 理 回 除 具 有 微 处 至 里 的 优点 外 ， 还 具有 易于 使 用 : 方便 姻 活 和 价格 便宜 等 优点 。 

现在 , 很 多 书籍 和 文章 都 介绍 了 DSP AES PRA Rg E UD 从 蕉 高 频 通 信 的 光纤 传输 
到 最 适合 音频 信号 处 理 的 DSP， 很 多 技术 已 经 用 来 进行 实时 处 理 。 处 理 器 常用 于 频率 范围 从 0 到 
20 kHz 信和 叶 的 实时 处 理 。 语 音信 号 可 用 8 kHz ( 采样 速度 ) 抽样 频率 进行 抽样 ， 这 意味 着 每 一 个 
抽样 点 的 抽样 时 间 是 1/8 kHz 或 0.125 ms, Mi CD 的 抽样 频率 通常 是 44.1 kHz, 现在 ， 抽样 频率 高 
TATE RARE BR) A/D 采集 板 也 能 够 买 到 。 

最 基本 的 应 用 系统 通常 有 一 个 模 数 转换 器 (ADC )， 用 来 捕获 模拟 信号 。 当 模拟 信号 转换 成 
数字 信号 后 ， 信 号 再 经 过 Cox 的 DSP 处 理 ， 最 后 进入 数 模 转换 器 (DAC), 变 成 模拟 信和 号 进行 输 
出 。 最 基本 的 应 用 系统 通常 还 合 有 一 个 输入 抗 汤 吉 滤波 器 和 一 个 输出 滤波 器 ， 它们 分 别 用 来 滤 除 
不 需要 的 带 外 信 生 或 平滑 、 重 构 处 理 过 的 输出 模 执 信 号。 


12 DSK 支持 工具 
本 书 的 大 部 分 工作 涉及 DSP 应 用 程序 设计 和 实现 。 为 了 进行 实验 ， 需 要 用 到 下 面 的 工具 ， 


2 DSP 原理 及 其 C 编程 开发 技术 


1，TI 公司 的 DSP 初学 者 工具 包 (DSK )。DSK 包括 : 
(a) 程序 代码 编辑 调试 软件 ( CCS )， 它 提供 了 必要 的 软件 支持 工具 和 和 集 C 编译 器 、 汇 编 
器 、 连 接 器 、 调 试 器 等 于 一 体 的 集成 开发 环境 (IDE ) 
(b) DSK 电路 板 ， 如 图 1.1 Bras, DSK 电路 板 上 有 TMS320C6711 (C6711 ) 浮 点 数字 信 
号 处 理 器 和 支持 16 位 输入 输出 的 编 解码 器 
( c) 连接 DSK 电路 板 和 PC 的 并 行 接口 电缆 ( DB25 ) 
(d) DSK 电路 板 电源 。 





(a) DSK 电路 板 
«TI 3.3 V p SDRAMQ) 128Kx8-bit 





* 子 板 VF 





Flash ROM 








TMs320C6211.| 
DSP 或 TMS320C6711 DSP 







户 指示 灯 1. | 
| LTLC320ADS35 16 位 ”指示 灯 2. 指示 灯 3 
| ”数据 转换 器 


(b) 电路 板 简 图 


图 1.1 基于 TMS320C6711 的 DSK 电路 板 


2. —4 IBM 兼容 PC，DSK 电路 板 通过 DSK 工具 包 中 的 DB25 电缆 与 PC 的 并 行 接口 相连 
3. 示波器 、 信 号 发 生 器 、 扬 声 器 各 一 台 ， 也 可 选用 信号 分 析 和 频谱 分 析 仪 器 。 可 使 用 共享 
软件 ， 利 用 PC 和 声卡 构建 如 示波器 、 函 数 发 生 器 或 频谱 分 析 仪 等 虚拟 仪器 
除 第 9 章 的 学 生 课 程 设 计 文 件 外 ,本 书 列 出 和 讨论 的 所 有 文件 和 程序 都 可 以 从 www.hxedu.com.cn 
或 www.phei.com.cn FX. 大 部 分 程序 实例 还 能 够 在 定点 C6211 DSK ( 现在 已 经 停产 了 ) 上 运行 


D 在 本 书 中 ， 所 有 从 这 两 个 网 站 下 载 的 文件 和 程序 统 都 称 为 辅助 材料 一 一 编者 注 





313 DSP 开发 系统 3 


1.2.1 DSK 电路 板 


DSK 工具 包 的 功能 很 强 而 价格 相对 较 便 宜 ( 目前 为 295 美元 )， 它 是 一 个 完整 的 DSP 系统 ， 
包括 了 实时 信号 处 理 必要 的 硬件 和 软件 支持 工具 ?331。DSK 电路 板 的 尽 寸 大 约 为 5x8 英寸， 上 
面 有 C6711 浮 点 数字 信号 处 理 器 和 16 位 的 AD535 输入 输出 编 解码 器 。 l 

DSK 板 上 的 AD535 编 解 码 器 采用 Sigma-Delta 技术 进行 模 数 和 数 模 转换 ， 利 用 DSK 板 上 
4 MHz 的 时 钟 产 生 固定 的 8 kHz 的 抽样 时 钟 。 

DSK 板 土 还 有 一 个 子 板 扩展 插 槽 ， 为 了 说 明 利 用 扩展 槽 进行 输入 和 输出 的 方法 ， 可 将 基于 
PCM3003 立体 声 编 解 码 器 的 音频 子 板 (《DSK 工具 包 中 不 包含 该 子 板 ) A DSK 板 上 的 80 脚 连 
接头 上 。 这 块 音频 子 板 可 从 TI AB), MF 对 该 子 板 的 特性 进行 了 描述 。PCM3003 编 解 码 
内 具有 可 变 的 抽样 速率 ,最 高 可 达 72 kHz， 这 对 于 需要 较 高 抽样 速率 的 应 用 是 很 有 用 的 ， 另外 它 
还 含有 两 个 可 用 的 输入 输出 通道 。 

DSK 板 上 有 16 MB 的 同步 动态 RAM (SDRAM ) 和 128 KB 的 Flash ROM. 两 个 连接 头 用 来 
作为 输入 和 输出 接口 ， 并 分 别 标 为 IN (77) 和 OUT (J6) 4 个 用 户 DIP 开关 中 ,有 3 个 开关 的 
状态 可 以 通过 程序 读 取 (有 一 个 程序 实例 利用 这 3 个 开关 实现 语音 加 扰 ) 板 上 的 DSP 时 钟 频率 
是 150 MHz， 另 外 ，DSK 板 上 的 稳 讨 器 为 C6711 核 提 供 1.8°V 的 电源 电压 ， 为 存储 器 和 外 围 电路 
提供 3.3 V 的 电源 电压 。 


1.2.2 TMS320C6711 数字 信号 处 理 器 


TMS320C6711 基于 超 长 指令 字 (VLIW) 的 体系 结构 ， 非常 适合 于 高 强度 的 数学 运算 。 内 部 
程序 存储 器 采用 特殊 的 设计 结构 ， 使 每 个 时 钟 周 期 可 取 8 条 指令 。 fiin, BUR DSP 时 钟 速率 为 
150 MHz， 那 么 C6711 RERETE 6.66 ns 内 取 到 8 个 32 位 的 指令 。 7 m 

C6711 还 有 72 KB 的 内 部 存储器 .5 个 ALU 单元 和 两 个 乘法 器 单元 组 成 的 8 个 功能 或 执行 单 
元 、 寻 址 空间 达到 4 GB 的 32 位 地 址 线 和 两 组 32 位 的 通用 青 存 器 。 . 

C67xx (如 C6701 和 C6711 ) 属于 C6x 溯 点 处 理 器 系列 ， 而 C62xx 和 C6dxx 属于 C6x 定点 处 理 


器 系列 。C6711 既 能 进行 定点 处 理 也 能 进行 溯 点 处 理 ， 关 于 它 的 结构 和 指令 集 将 在 第 3 章 讨论 。 
13 程序 代码 编辑 调试 软件 


程序 代码 编辑 调试 软件 (CCS) 是 一 个 集成 软件 工具 的 集成 开发 环境 CIDE ^ 它 不 仅 提供 产 
生 程序 代码 的 工具 ， 如 C 编译 器 、 汇 编 器 和 连接 器 ， 还 具有 绘图 功能 以 及 支持 实时 调试 功能 。 该 
软件 易于 使 用 ， 是 实现 产生 程序 代码 和 调试 程序 的 软件 工具 。 

C 编译 器 编译 扩展 名 为 .c A CER. 生成 扩展 名 为 asm 的 汇编 源 文件 。 汇编 器 汇编 扩展 名 
为 .asm 的 汇编 源 文件 ， 生 成 机 器 语言 的 目标 文件 ， 其 扩展 名 为 obj。 连接 器 将 目标 文件 和 库 文件 
连接 起 来 ， 生 成 扩展 名 为 .out 的 可 执行 文件 。 该 可 执行 文件 表示 成 已 连接 的 通用 目标 文件 格式 
(COFF ),， 这 种 格式 在 UNIX 操作 系统 中 很 流行 ， 也 被 许多 数字 信息 处 理 咒 的 制造 商 采 用 2&0。 可 
执行 程序 可 以 加 载 到 系统 上 ， 直 接 在 C6711 处 理 器 上 运行 。 

为 了 创建 一 个 应 用 工程 ， 可 忆 使 用 “add” 药 单 ， 在 该 工程 中 添加 合适 的 文件 。 可 以 简单 设置 





D 1 英寸 =2.54em 一 一 编者 注 ， 





4 DSP 原理 及 其 C 编程 开发 技术 


编译 器 /连接 器 的 选项 ， 并 可 以 利用 老 种 调试 功能 ,， 包 揪 设 置 斯 点 、 观 察 变 量 、 存 储 器 和 寄存 器 内 
AUR C 和 汇编 的 混合 编程 程序 代码 、 图 形 化 结果 、 监 控 执 行 时 间 等 ,还 可 用 不 同方 法 执行 程序 
{ 如 跟踪 进入 函数 、 跳 过 函数 、 跳 出 函数 等 方式 )。 

可 以 通过 和 DSP/BIOS (参见 附录 GO 相关 的 实时 数据 交换 ( RIDX ) 实现 数据 的 实时 分 析 ， 
RTDX 可 将 主机 和 目标 板 实现 实时 数据 交换 ， 不 需要 停止 目标 板 来 进行 实时 分 析 ， 并 能 实时 监控 
关键 的 统计 数据 和 性 能 。 通 过 TAG 接口 和 片上 的 仿真 通信 工具 通信 ， 从 而 控制 和 监控 程序 的 运 
行 。C6711 DSK 目标 板 上 有 一 个 JTAG 仿真 接口 。 


1.3.1 CCS 的 安装 和 支持 


首先 用 《打印 机 的 ) 并 行 电缆 DB25 将 DSK 目标 板 ( 开 ) 和 PC 的 并 行 接口 (LP1 或 LP2 ) 
连接 起 来 , 然后 将 DSK 工具 包 中 的 5Y 电源 适配器 连接 到 电源 接头 J4 上 ,再 接 通 DSK 电源 开关 ， 
FA DSK 附带 的 CD-ROM 安装 CCS， 安 装 中 最 好 采用 ci 路 径 (BB). 

计算 机 桌面 上 的 CCS 图 标 是 “CCS 2[°C 6000]”, 可 双击 它 来 运行 CCS, 使 用 的 程序 代码 生 
ELR (CHR, CRR ERR ) 的 版 本 是 4.1。 

在 通电 时 ， 在 4 个 用 户 DIP 开关 附近 的 3 个 发 光 二 极 管 (LED) 灯会 从 1 到 了 进行 计数 (二 
tfl D. 

CCS 提供 了 有 关 下 面 内 容 的 文档 ， 这 些 文 档 包 含 在 DSK 工具 包 中 【参见 Help 图 标 ); 


， 程 序 代码 生成 工具 CHNVERE, CR. EERS), 
，CCS、 编 译 器 、RTDX 以 及 高 级 DSP/BIOS 手册 。 
. DSP 指令 和 寄存 器 。 

. RTDX. DSP/BIOS 工具 等 。 


CCS a A A e e bh. (PDF 文件 Bl CCS 还 附带 有 许多 程序 实例 ， 如 DSK 性 能 测 
试 程序 、 音 频 程序 以 及 与 板 上 Flash 有 关 的 程序 实例 。 

本 书 中 的 程序 是 用 第 2 RR CCS 来 生成 和 测试 的 ，cxti 目录 里 包 合 下 面 一 些 子 文件 夹 和 目录 ， 
它们 中 的 许多 文件 是 非常 有 用 的 : 


. docs: 包含 文档 和 用 户 手册 。 

. myprojects: 工程 文件 夹 ， 本 书 中 讨论 的 所 有 程序 和 工程 都 可 保存 在 该 于 目录 下 面 。 
. c6000\cgtools: 包含 程序 代码 生成 工具 。 

. bin: 包含 许多 实用 程序 。 

c6000\cxamples: 包含 CCS 中 的 编程 实例 。 

，c6000\rtdx: 包含 实时 数据 交换 的 支持 文件 。 
，c6000\bios: 包含 DSP/BIOS 的 支持 文件 。 


13.2 有 用 的 文件 类 型 
不 同 的 文件 有 不 同 的 扩展 名 ， 比 如 下 面 的 文件 扩展 各， 


|. pit: 创建 或 建立 的 工程 文件 。 
2..c:_C 源 程序 文件 二 
3. asm: 程序 员 、C 编译 器 或 线性 汇编 优化 器 创建 的 汇编 源 程 序 


A W 一 
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4. sa: 线性 汇编 源 程 序 文件 ， 线 性 优化 器 输入 .sa 文件 ， 生 成 汇编 源 程序 .asm 文件 。 
5. h: Sore, 

6. lib: 库 文 件 ， 如 实时 运行 支持 库 文件 rts6701.lib。 

7. emd: 连接 命令 文件 ， 这 种 文件 将 段 腕 射 到 存储 器 。 

8. .obj: 汇编 器 创建 的 目标 文件 。 

9. out: 连接 器 创建 的 可 执行 文件 ， 这 种 文件 可 加 载 到 处 理 器 上 并 可 运行 。 


14 测试 DSK 工具 的 编程 实例 


本 节 用 三 个 编程 实例 来 说 明 CCS 和 DSK 电路 板 的 特点 ， 主要 任务 是 熟悉 软件 和 硬件 工具 ， 
强烈 建议 在 学 习 后 续 章 节 前 ， 练 习 完 这 三 个 编程 例子 。 


1434 DSK 的 快速 测试 


从 桌面 图 标 启动 CCS, 依次 选择 菜单 GEL Check DSK—Quick Test, 菜单 Quick Test 可 用 于 
确定 操作 和 安装 是 否 正确 ， 之 后 将 显示 如 下 信息 ， 

Switches: 7 

Revision: 2 

Target is OK 

显示 以 上 信息 的 前 提 是 假定 前 三 个 开关 : USER_SW1, USER. SW2 和 USER_SW3 都 在 上 面 
位 置 (也 就 是 ON 位 置 ) 再 将 这 三 个 开关 设置 为 110 (以 二 进 制 表示 )， 这 时 前 两 个 开关 设置 在 
上 面 位 置 (第 三 个 开关 设置 在 下 面 位 置 )， 第 四 个 开关 是 不 用 的 。 

重复 上 面 的 步 琶 ， 恢 次 选择 荣 单 GEL—Check DSR 一 Quick Test， 这 时 开关 的 值 显 示 为 3( 显 
示 信 息 为 “Switches: 3" ), 可 将 开关 值 设 置 为 从 0 到 7 的 任何 一 个 数 。 在 程序 设计 中 ， 可 根据 这 有 & 
个 不 同 的 值 来 引导 程序 的 执行 。 注 意 Quick Test 使 发 光 二 极 管 (LED) 周期 性 闪 亮 兰 次 。 

RATE DSK 中 的 性 能 检测 编程 实例 ， 可 用 来 检测 和 检验 DSK 上 的 主要 器 件 是 否 正 常 工作 ， 
st, LED, SDRAM, DMA, #770 RGERIHRAS, 


DSK 的 务 一 种 快速 测试 方法 

1. 从 桌面 图 标 打 开 / 启 动 CCS， 然 后 选择 菜单 File :Load Program， 读 取 从 网 上 下 载 的 辅助 
材料 ， 点 击 文 忻 夹 sine8_int， 打 开 (装载 ) 文件 sine. introut, 这 样 就 将 可 执行 文件 
sine8 intr.out 装载 到 C6711 Jh EBAE Hp 

2. 选择 菜单 Debug--*Run, 将 DSK 板 上 的 OUT (连接 头 J6) 与 扬声器 或 示波器 相连 ， 检 验 
是 否 有 1 kHz 的 音频 信和 号 。DSK 板 上 的 IN/OUT 连接 头 是 一 个 3.5 mm 的 音频 播 座 ， 


文件 来 sine8_intr 有 支持 例 1.1 的 必要 文件 ， 通 过 例 1.1 可 以 说 明 这 些 工具 的 一 些 特点 。 


1.4.2 支持 文件 


在 PC 硬盘 上 创建 一 个 和 名 为 sine8_infr 的 新 文件 夹 ， 建议 将 该 文件 夹 放 在 目录 cA myprojects 
里 《假设 CCS 的 安装 目录 为 cti )。 本 书 例 子 中 使 用 的 一 些 支持 文件 在 辅助 材料 的 support X 
FEE, 暂且 不 必 过 分 担心 这 些 文件 的 内 容 或 功能 , DSK 工具 包 附 带 的 CCS CD-ROM 中 还 有 
其 他 一 些 支 持 文件 ,将 下 面 所 列 的 支持 文件 从 文件 严 support 复制 到 硬盘 上 所 建 的 sineg_intr 文件 严 中 。 
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. c6xdsk.cmd: 连接 命令 文件 样本 。 

. e6xdsk.h: 定之 外 部 存 情 髓 接口 、 串 行 口 等 地 址 的 头 文 件 (CCS 中 开 的 支持 文件 》 

. e6xinterrupts.h: 包含 中 断 的 init 函数 (DSK 中 TI 的 支持 文件 )。 

. coxdskinith: 包含 函数 原型 的 头 文件 。 

. c6xdskinitc: 含有 CCS 中 程序 实例 codec, poll 用 到 的 用 个 函数 ， 包 括 DSK、 编 解码 器 ， 
串 行 口 及 输 人 输出 的 初始 化 函数 。 

. vectors ll.asm: vectors.asm 的 版 本 包含 在 CCS 中 ,但 可 以 修改 它 来 处 理 中 断 。 可 以 使 用 

”从 INT4 B| INT!5 的 12 个 中 断 ， 该 矢量 文件 中 选择 中 斯 TNT1L。 


另外 , 还 要 将 C 源 文件 sine8_intrc 和 GEL 文件 amplitude.gel 从 辅助 材料 sine, intr 文件 夹 中 
复制 到 硬盘 文件 夹 sine8_intr 中 。 

注意 , 如 果 使 用 C6211 DSK( 现 已 停止 生产 ), 则 要 修改 文件 cóxdskinit.c 中 的 函数 comm intr, 
将 其 中 的 XINTO 改 为 XINT1， 这 是 由 于 C6211 芯片 中 存在 一 个 程序 漏洞 (Bug )。 


14.3 ”程序 实例 


Bii. 用 8 点 产生 正弦 波 

本 例 用 查 表 方 法 产生 一 个 正弦 波 。 虽然 其 功能 简单 ， 但 重要 的 是 ， 它 展示 了 CCS 在 编辑 、 
创建 工程 、 访 问 程 序 代码 生成 工具 和 在 C6711 上 运行 程序 的 一 些 特点 。 图 1.2 是 产生 正弦 信和 号 
ÁJ C BFF sine8_intrc。 


ta b w b =e 


[=a 


//sineB intr.c Sine generation using 8 points, f-Fs/!4 of points) 
//Comm routines and support files included in Céxdskinit.c 


short loop = 0; f . 
short sin table[B] = (0,707,1000,707,0,-707,-1000.-707); //sine values 
short amplitude - 10; //gain factor 


interrupt void c intl11() /finterrupt service routine 
{ 
output sampleí(sin table[loop]*ampilitude)!; //output each sine value 


if (loop < 7) ++loop; //increment index ioop 
else loop = 0; //reinit index @ end of buffer 
return;  . . //return from interrupt 


} 


void main{)} 

{ 
comm intrí); //init DSK, codec, McBSP 
while(1); /finfinite loop 

} 








图 1.2, 用 8 点 产生 止 纺 波 的 程序 ( sine8 intr.c ) 


TTE cp PERS [SDN 
尽管 本 例 的 重点 是 介绍 一 些 工具 , 但 是 理解 程序 sines inre 是 很 有 帮助 的 。 程 序 创建 表 或 组 
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PRIX sin table, >4 + = 0, 45, 90, 135, 180, 225, 270 和 315 BER, FER PRB OR HERE sinc) 
8 个 点 的 值 (8 个 点 的 值 都 乘 以 1000). 在 main 函数 中 , 调用 另 一 个 函数 comm_intr， 该 函数 在 通 
信 支 持 文件 cóxdskinitc H, EWE DSK, DSK 板 上 的 AD535 编 解码 器 以 及 C6711 处 理 器 中 的 
两 个 多 通道 缆 冲 串 行 端口 (MecBSP )。 

main RRAS while(D) 语 句 产生 一 个 无 限 循环 ， 等 待 中 断 发 生 。 一 晶 有 中 断 发 生 ， 程 序 就 进 
人 中 断 服务 程序 CISR ) c_int11 执行 ，ISR 地 址 在 文件 vectors_Ii.asm 中 由 分 支 指令 指定 ,这 里 使 
用 中 断 INTIL, 第 3 章 中 将 详细 讨论 中 靳 间 题 。 . 

在 ISR 中 ， 调 用 通信 支持 文件 c6xdskinite 中 的 output, sample 函数 ， 用 它 来 输出 表 或 缓冲 区 
中 的 第 一 个 数据 sin_table[0] = 0。 选 择 数据 的 循环 变量 依次 增加 直到 指向 表 的 结尾 ， 这 时 ,该 循 . 
环 变量 重新 初始 化 为 0， 程序 执行 由 ISR 返回 到 无 限 循环 while(1), 等 待 下 一 次 中 断 的 发 生 。 

每 个 抽样 周期 为 了 = MF, = 1/8000 = 0.125 ms, 每 隔 这 个 时 间 段 产生 一 次 中 断 。 每 次 中 断 发 
生 后 ， 就 进 人 中 断 服务 程序 ， 表 sin table (amplitude = 10 定 标 ) 中 的 一 个 个 数据 依次 送 到 编 解 
偶 玫 的 输出 上 ， 从 而 产生 正弦 信号 。 输 出 信号 的 周期 为 7 = 8 x 0.125 = 1 ms, 相应 的 频率 为 
f = UT= 1 kHz, . 


创建 工程 
在 本 节 中 ， 主要 介绍 如 何 创建 一 个 工程 。 我 们 考虑 为 了 创建 名 为 sine8_intr HIE, PHR 
加 哪些 必要 的 文件 。 点 击 桌面 图 标 ， 进 人 CCS 运行 环境 。 


IT， 创建 名 为 sine8_intr.pit 的 工程 文件 ,选择 菜单 ProjectNew, A LUE sine8 intr, 
如 图 1.3(a) 所 示 , 该 工程 文件 保存 在 sines intr 文件 夹 中 ( Eft F c:\timyprojects XF 
FO 扩展 名 为 .pjt 的 工程 文件 保存 工程 文件 build 的 选项 、 源 文件 名 和 相互 关系 等 有 关 该 
工程 的 信息 。 

2 在 工程 文件 中 添加 文件 : 选择 菜单 Project Add Files to Project, ft sine8 intr 工程 中 查看 
C 源 程 序 文件 ， 打 开 coxdskinit.c 和 sine8 intrc 两 个 已 源 文件 。 一 次 打开 一 个 文件 并 添加 
到 工程 中 ; 或 者 将 鼠标 指向 某 个 文件 ， 按 住 Shin gt, 再 将 鼠标 指向 另 一 个 文件 ， 然 后 点 
if Open Bits, 再 点 击 CCS 中 工程 文件 窗 口 左 边 的 “4+” 符号。 将 工程 目录 展开 后 ， 检 查 
C 源 文 件 是否 已 添加 到 该 工程 中 。 

3. 选择 菜单 Project-*Add Files to Project, Tk sine8_intr 工程 中 查找 文件 ， 使 用 选择 文件 类 型 
的 下 拉 菜 单 ， 选 择 ASM Source Files, 双击 汇编 源 文 件 vectors 11.sm. 将 它 打开 /添加 到 
工程 中 。 

4. 重复 步骤 3， 但 选择 的 文件 类 型 是 Linker Command File， 将 连接 命令 文件 coxdsk.cmd 添 
加 到 工程 中 。 

5， 重 复 步骤 3, 但 选择 的 文件 类 型 是 Object and Library Files ,查看 目录 c\:ti\ c6000 \egtools\lib, 
选择 实时 运行 支持 库 文件 rs6701.ib ( 它 支持 C67w/C62x 结构 )， 将 它 添加 到 工程 中 。 这 
里 假定 是 把 CCS 安装 在 默认 目录 ci F. 

6. 办 查 连接 命令 文件 ( .cmd )、 工程 文件 ( .Pt)、 库 文件 ( ,lib )、 两 个 C 源 文件 (e) 和 汇编 
XPF asm) 是 否 已 添加 到 工程 中 。 当 创建 工程 时 ,GEL 文件 dsk6211_6711.gel & Ej iji 
加 到 工程 中 ， 它 会 初始 化 DSK, . 

7. 注意 这 时 还 没有 include 文件 ， 选择 菜单 Project—Scan All Dependencies, 这 样 就 可 添加 头 
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文件 c6xdsk.h, c6xdskinit.h, c6xinterrupts.h 和 c6x.h。 前 三 个 文件 可 从 辅助 材料 中 复制 进 
来 ， 而 头 文件 c6x.h 包含 在 CCS 中 。 
CCS 中 的 文件 窗口 看 上 去 和 图 1.3(b) 所 示 类 似 。 除 了 库 文件 外 ， 点 击 CCS 窗口 中 任何 文件 都 
可 以 显示 它们 的 内 容 。 当 选择 Scan All Dependencies 时 ， 会 自动 添加 头 文件 或 包含 文件 ， 而 不 需 
要 手动 添加 。 


C:\t\myprolects\sineB_ntr\ F 


(a) 创建 工程 界面 





Ec 国 GEL Hes 
di 0SK6211_6711 ge! 
E (gg Proyects 
C) gm sineB inur.pit 
CExdsk cmd 
(ga DSP/BIOS Contig 
(Bd Generated Files 
C! {iy Include 


cbx.h 

(E) cBxdsk h 
cbxdskint h 
cbxinterrupts.h 


日 (gg Libranes 
由 56701 bib 
& (gg Source 


[9] c&xdskinit.c 
[*) sine inti c 
vectors 11.asm 





(b) 工程 文件 列表 
图 1.3 CCS 创建 和 显示 sine8 intr 工程 时 的 界面 


当然 也 可 以 使 用 简单 方法 ， 就 是 将 不 同 的 窗口 文件 “ 拖 到 ”CCS 工程 窗口 中 。 
代码 生成 和 选项 设置 


程序 代码 生成 工具 C 编译 器 和 连接 器 有 许多 不 同 的 设置 选项 ,为 了 创建 一 个 工程 ， 需 要 对 这 
些 选项 进行 不 同 的 设置 。 
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编译 器 选项 

选择 菜单 Project Build Options, 图 1.4(a) 显 示 了 编译 器 在 Build Options 选项 时 的 CCS 窗口 。 
选择 下 面 的 编译 器 选项 ，(a) Basic (YE Category 选项 栏 中 选择 ) (b) Default ( 在 Target Version 3 
项 栏 中 选择 ); (c) Full Symbolic Debug ( 在 Generate Debug Info 选项 栏 中 选择 ); (d) Speed most 
critical ( 在 Opt Speed vs. size 选项 栏 中 选择 ); e) None ( TE Opt Level 和 Program Level Opt 选项 
栏 中 选择 )。 结 果 编 译 器 选项 变 成 : 

-gks 
-k 选项 表示 保留 汇编 源 文件 sine8_intasm, -g 选项 多 许 显示 符 导 调试 信息 ， 这 在 调试 过 程 是 非 
常 有 用 的 ， 将 它 与 -s 选项 一 起 使 用 司 将 C 源 文 件 和 产生 的 汇编 文件 sine8_intr.asm 交叉 列 出 清单 
来 。-g 选项 表示 禁止 程序 代码 优化 ， 以 便 使 调试 过 程 更 加 方便 。 

在 Target Version 选项 栏 选择 Default， 表 示 启 用 定点 实现 方式 ( 如 果 使 用 C6211 DSK， 则 必 
须 使 用 该 选项 : C6711 DSK 既 可 以 使 用 定点 处 理 方式 ， 也 可 以 使 用 浮 点 处 理 方式 ， 本 书 中 大 多 
数 程序 例子 可 用 定点 方式 运行 。 对 于 第 6 章 和 第 7 章 中 的 程序 例子 ， 就 要 选择 C671x， 启 用 浮 点 
处 理 方式 。 

如 果 选 择 No Debug (E Generate Debug Info 选项 栏 选择 ) 以 及 ~03: File (TE Opt Level 选项 
栏 中 选择 )， 编 详 器 选项 就 会 自动 改 成 : 

-ks -o3 
03 选项 表示 对 性 能 和 执行 速度 进行 最 高 级 的 优化 ， 因 为 暂时 对 速度 要 求 并 不 是 很 严格 〈 调试 时 


也 是 这 样 )。 编 译 器 选项 -gks 也 可 以 在 编译 命令 窗口 中 直接 键 人 。 为 了 调试 方便 ， 开 始 调试 时 ， 
厅 需 要 对 速度 进行 优化 ， 文 献上 中 对 许多 编译 器 选项 进行 了 介绍 。 


连接 器 选项 
从 CCS Build Options 窗口 中 点 击 Linker 选项 ， 在 Output Module 选项 栏 中 选择 Absolute 


Executable, ZE Output Filename 选项 栏 中 键入 sine8_introut, 在 Autoinit Model 选项 栏 中 选择 Run-time 
Autoinitialization， 输 出 文件 名 默认 是 ,pjt 文件 ， 这 时 连接 器 选项 应 如 图 1.4 中 ) 所 示 ， 也 就 是 : 

-g -c -o "sine8,intr.out" -x 
一 选 项 用 于 在 运行 时 初始 化 变量 ,~o 选项 用 于 命名 连接 后 输出 的 可 执行 文件 名 sine8 introut, f£ 
下 OK 按钮 。 

注意 ， 可 以 选择 把 可 执行 文件 保存 到 一 个 子 文件 夹 Debug 中 ， 特 别 是 在 调试 一 个 工程 期 间 ， 
这 样 做 是 非常 必要 的 。 

同样 ， 也 可 以 直接 从 适当 的 窗口 键 人 这 些 命令 。 

建立 和 运行 工程 

现在 可 建立 和 运行 工程 sine8_intr， 过 程 如 下 所 示 。 

1. ÆVI sine8 inr; 选择 菜单 Project 一 Rebuild Alt, 或 按 下 带 有 二 个 向 下 箭头 的 工具 条 ， 

这 样 CCS 就 会 调用 cl6x 对 所 有 C 源 文件 进行 汇编 和 编译 ， 调 用 asm6x 对 汇编 文件 


vectors 11.asm 进行 编译 ,Ink6x 将 生成 的 目标 文件 和 运行 库 支持 文件 rts6701.ib 连接 起 来 ; 
最 后 生成 可 执行 文件 sine8_introut, 该 文件 可 直接 加 载 到 C6711 处 理 器 上 运行 。 注 意 汇编 、 
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编译 和 连接 的 命令 要 和 Build options 中 的 设置 配合 在 一 起 执行 。 上 述 命令 执行 后 , 还 会 生 
成 一 个 记录 文件 cc_build_debug.log， 文 件 中 包含 经 过 汇编 、 编 译 的 文件 以 及 所 选择 的 编 
译 选 项 设置 的 信息 ， 同 时 还 列 出 了 使 用 的 支持 函数 。 图 1.5 显示 了 CCS 工程 sine8_intr 的 
几 个 窗口 。 


， 选 择 菜 单 File>Load Program. 5 过 点 击 sine_intr.out 装载 该 文件 (CCS 有 一 个 选项 ,在 


建立 工程 后 会 自动 装载 该 六 了 )， 它 应 该 在 sine8_intr 文件 夹 中 。 选 择 菜 单 Debug 一 Run， 
或 使 用 工具 栏 中 的 “ 足 者” 图标, 将 DSK 板 上 的 OUT 连接 头 (J6 ) 和 扬声器 连接 起 来 ， 
就 可 听 到 音频 信号 。 


“gt AT MAmyproyectivoneB. nni 


f 
Fu Symbolic Debug {-9] 
| 
| 
| 


Speed Most Critical (no ms] 
Nore 


| 





(b) 连接 器 子 窗口 
图 1.4 CCS 选择 Build Options 时 的 窗口 
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/rgineB_ intr.c Sine generation using B points, f-Fs/(# of 
/^Comm routines ond support files included in Céxdskinit. 


short loop 
hort sin Peabiet8) 。 人 707.1000. n E -707,-1000.-707); 
Ishort amplit /gain fac 


interrupt void c intli() interrupt service routine 
{ 


output sample(sin table[loopj*amplitude); “output each 
pone ^/increment index loop 

reinit index @ end of buffer 
return from interrupt 


comm intr(): //init DSK, codec, McBSP 
while(1): infinite loop 





图 1.5 T sine8 intr 的 CCS 窗口 


编 解码 器 抽样 频率 F, 固定 在 8 kHz, 产生 的 频率 f= Fy 点 数 = 8 kHz/8 = 1 kHz, 将 DSK 的 输 
出 连接 到 示波器 上 ， 检 验 是 否 有 振幅 ( 峰 - 峰 值 ) 大 约 为 0.85 V、 频 率 为 1 kHz 的 正弦 信号 。 


Watch Window (观察 窗口 ) 
检查 处 理 器 是 否 仍 在 运行 ,注意 在 CCS 的 左下 方 有 一 个 “DSP RUNNING” 指 示 标 志 。 从 观 
察 窗 口 可 以 改变 参数 的 值 ， 或 者 监视 变量 随 程 序 运行 的 变化 情况 ， 过 程 如 下 所 示 。 


1. 选择 菜单 View 一 Quick Watch window， 观 察 窗口 就 出 现在 CCS 的 下 方 ,， 输入 amplitude 
变量 ， 然 后 点 击 Add to Watch， 程 序 中 设置 幅度 为 10， 该 值 就 会 显示 在 观察 窗口 里 ， 如 
图 1.2 所 示 。 

2. 将 参数 amplitude 的 值 从 10 改 成 30。 

3. 检查 产生 的 音频 音 的 音量 是 否 已 经 增 大 了 ( 注意 处 理 器 还 在 运行 )， 这 时 正弦 波 的 幅度 从 
KA 0.85 V 增加 到 大 约 2.6V ( 峰 -峰值 )。 

4. 将 参数 amplitude 的 值 改 为 33 ( 和 步骤 2 相同 )， 检 验 是 否 音调 已 变 高 ， 这 看 上 去 好 像 只 
要 改变 正弦 波 的 幅度 就 可 改变 正弦 波 的 频率 ， 事 实 并 非 如 此 ， 这 是 因为 输出 已 经 溢出 了 
16 位 编 解 码 器 AD535 的 范围 。 由 于 表 中 的 所 有 数 都 再 乘 以 33， 所 以 这 时 表 中 数值 的 范围 
在 +33000 和 -33000 之 间 ; 又 因为 AD535 的 输出 范围 限制 在 -2” 到 (25— 1) 之 间 ， 即 从 
-32 768 到 +32 767， 所 以 导致 输出 产生 溢出 现象 。 不 要 试 着 将 超过 16 位 的 数据 送 到 编 解 
码 器 ， 否 则 可 能 导致 溢出 。 板 上 的 编 解 码 器 数据 格式 采用 的 是 二 进 制 补 码 。 


纠正 程序 错误 


1. 删除 语句 short amplitude = 10; 中 的 分 号 。 如 果 没 有 显示 C 源 文件 sine8_intr， 则 
从 文件 窗口 双击 该 文件 。 
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2， 选 择 菜 单 Debug 一 Build， 该 选项 执行 的 是 只 对 单个 文件 进行 编译 或 使 用 带 有 两 个 (不 是 
三 个 ) 箭头 的 工具 条 ,选择 Build 是 只 对 C 源 程序 sine8_intr.c 进行 编译 ， 而 Rebuild 选项 
( 三 箭头 的 工具 条 ) 则 会 对 已 编译 或 汇编 的 文件 再 进行 一 次 不 必要 的 编译 汇编 。 

3. TE CCS 的 Build 窗口 (CCS 窗口 的 左下 方 ) 就 会 出 现 一 条 错误 消息 ， 并 且 用 红色 的 高 亮 
行 显示 出 来 ， 并 在 后 面 用 a “; ”is expected ( 需要 用 分 号 ) 解释 错误 原因 。 为 了 更 好 地 显 
示 错 误 信息 ， 就 需要 将 Build 窗口 缩小 。 如 果 双 击 高 亮 的 错误 信息 行 ， 就 会 将 光标 移动 
到 产生 错误 的 程序 代码 部 分 。 对 程序 做 适当 的 修改 ， 再 编译 一 次 ， 装 载 并 运行 程序 ， 检 
验 前 面 修 改 的 结果 。 


使 用 滑动 条 GEL 文件 

通用 扩展 语言 (GEL ) 是 一 种 类 似 于 C 语言 的 解释 语言 CC 语言 的 子 集 )， 它 允许 处 理 器 在 
运行 时 通过 GEL 文件 的 滑动 条 改变 变量 的 值 。 例如, 通过 滑动 条 滑动 到 不 同 的 值 , 就 可 以 改变 信 
号 的 幅度 ， 所 有 的 变量 事先 要 在 程序 中 定义 。 


1 选择 菜单 File—Load GEL， 打 开 文 件 amplitude.gel， 该 文件 是 从 辅助 材料 复制 到 文件 来 
sine8_intr 中 的 。 为 了 在 CCS 里 查看 amplitude.gel， 双 击 该 文件 ， 这 样 文件 就 显示 在 文件 
窗口 中 , 文件 如 图 1.6 所 示 。 通 过 在 文件 中 创建 如 图 1.6 所 示 的 滑动 条 函数 amplitude, JF 
始 时 选择 幅度 变量 的 初始 值 10 ( 第 一 个 值 )， 它 是 在 C 程序 中 设置 的 ， 最 高 值 为 35 (第 
二 个 值 )， 按 照 步 进 值 为 5 往 上 递增 ( 第 三 个 值 )。 


/*Amplitude.gel Create slider and vary amplitude of sinewave*/ 

menuitem "Sine Amplitude" 

slider Amplitude(10,35,5,1,amplitudeparameter) /*start at 10,up to 35*/ 
( 


amplitude - amplitudeparameter; /*vary amplit of sine*/ 
) 





图 1.6 在 正弦 信号 产生 程序 中 ， 用 滑动 条 选择 不 同 幅 度 的 GEL 文件 ( amplitude.gel ) 


2. 选择 菜单 GEL 一 Sine Amplitude 一 Amplitude， 这 时 将 会 弹 
出 如 图 1.7 所 示 的 滑动 条 窗口 ， 幅 度 的 最 小 值 为 10。 

3. 按 一 下 键盘 的 向 上 箭头 键 ， 如 滑动 条 窗口 显示 那样 ， 将 幅度 
值 从 10 增加 到 15, 检验 产生 的 正弦 波 的 音量 是 否 增 大 了 。 再 
按 一 下 向 上 的 箭头 键 ， 继 续 提 高 滑动 条 指针 位 置 ， 幅 度 由 5 
增加 到 30。 当 amplitude 设 为 30 时 ， 正 弦 波 的 幅度 应 该 是 
2.6V 左右 ( 峰 -峰值 ), 现在 , 用 鼠标 点 击 滑动 窗口 ， 慢 慢 地 
将 滑动 条 指针 的 位 置 提高 到 31， 然 后 再 提高 到 32， 检 验 产 
生 的 信号 频率 是 否 还 是 1 kHz. 当 滑 动 条 指针 增加 到 33 时 ， 
检查 所 产生 的 信号 不 再 是 1 kHz 正弦 波 ( 而 是 含有 1 kHz 和 
3 kHz 两 个 正弦 音 的 信号 )。 表 中 的 所 有 数 和 幅度 变量 的 值 相 
乘 ， 从 而 使 输出 在 +33 000 到 -33 000 之 间 (超过 了 编 解码 器 可 以 接受 的 范围 )。 





图 1.7 改变 正弦 波幅 度 的 
CCS 滑动 条 窗口 
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和 前 面 使 用 一 个 滑动 条 一 样 ， 也 可 以 很 方便 地 使 用 两 个 滑动 条 : 一 个 控制 幅度 ， 另 一 个 控制 
频率 。 在 C 程序 中 , 通过 改变 循环 变量 来 产生 不 同 的 频率 (和 参见 例 2.4, 在 表 中 每 两 点 步 进 一 次 )。 
当 创 建 完 一 个 工程 后 , 关闭 CCS 时 , 有 关 该 工程 所 有 改变 的 选项 就 会 保存 下 来 。 当 再 次 打开 该 工 
程 时 ， 其 设置 的 状态 和 上 次 关闭 该 工程 时 是 一 样 的 。 


例 1.2 产生 正弦 信号 和 使 用 CCS 画图 | 

和 例 1.1 一 样 ， 本 例 也 产生 8 个 点 的 正弦 信号 .更 重要 的 是 ， 它 介绍 了 CCS 在 频 域 和 时 域 中 
的 画图 功能 。 程 序 sine8_bufe (如 图 L8 POR) 实现 了 该 工程 ， 它 在 存储 器 中 创建 一 个 缓冲 区 ， 
并 将 输出 数据 存储 到 该 缓冲 区 中 。 


//sine8 buf Sine generation. Output buffer plotted within ccs 
//Comm routines and support files included in Cóxdskinit.c. - 


short loop = 0; PC 
short sine table[8] = (0,707,1000,707,0,-707,-1000,-707);  //sine values 


short out buffer[256]; /foutput buffer 

const short BUFFERLENGTH = 256; //8ize of output buffer 

short i = 0; //for buffer count 

interrupt void c intl11() /finterrupt service routine 

{ . . 
output sampleísine table[loopl): //output each sine value 
out buffer[i] = sine table[loop]; //output to buffer 
i++; //increment buffer count 
if (i == BUFFERLENGTH) i = 0; //if bottom reinit buffer count 
if (loop < 7) ++loop; {increment index loop 
else loop - 0; //if end of buffsr,reinit index . 
return; mE 


} 


void mainí) 
comm intr(í); 4 _/finit DSK, codec, McBSP 
while(i); .. //infnite loop 

) 0s 





图 1.8 下 就 波 产 生 程序 ， 输 出 保存 在 存储 器 中 ( sine8_ bufc) 


创建 名 为 sine8_bufpit HLE, PP 1.1 一 样 ， 在 工程 中 添加 必要 的 文件 ( FH sine& buf.c 代 
# sineB intnc), TEM, EARRA Project—Scanning All Dependencies, Hs BRUISES 
加 到 该 工程 中 ， 该 工程 的 所 有 支持 文件 在 sineg buf THIER ( 在 辅助 材料 中 六 

建立 工程 sine8_buf， 装 载 并 运行 可 执行 文件 sine8_bufout， 通 过 连接 到 输出 的 扬声器 或 示 波 
髓 ， 检 查 是 否 产生 了 1 kHz HERAS (和 例 1.1 一 样 


用 CCS 画图 


输出 缓冲 区 不 断 地 更 新 ， 每 隔 256 个 点 更 新 一 次 (改变 缓冲 区 大 小 非常 容易 )， 下 面 介绍 用 
CCS 画 出 存储 在 缓冲 区 out. buffer 中 当前 输出 数据 的 步骤 。 
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1. 选择 菜单 View—Graph—Time/Frequency . 

2， 改 变 Graph Property Dialog 中 的 选项 ， 如 图 1.9(a) 所 示 ， 将 选项 设置 为 时 域 图 (适当 使 用 
下 拉 菜 单 ) 并 将 输出 缓冲 区 的 起 始 地 址 设置 为 oot_buffer, 其 他 选项 保留 默认 值 , 图 1.10 
显示 了 正弦 信号 的 时 域 图 

3. 图 1.9 (b) 给 出 了 CCS 用 Graph Property Display 显示 的 频 域 图 ， 选 择 FFT 的 阶 数 n， 以 便 
H YEH FFT 的 帧 长 。 按 下 OK 按钮 ， 检 验 FFT 的 幅 频 图 是 否 和 图 1.10 一 样 ，1000 Hz 
处 的 尖峰 信号 表示 产生 的 正弦 信号 。 


FFT Magnitude _ 
| Graphical Display 
| Real 

out, buffer 

Acquisition Buffer Size 256 
Index increment | 
FFT Framesize 256 


Single Time 
Graphical Display 
Start Address out_buffer 
Acquisition Buffer Size 256 
Index Increment 1 


FFT Order 18 

FFT Windowing Funct Rectangle 

Display Peak end Ho Of 

DSP Date Type | 16-bit signed integer 
Q-value 0 

Sampling Rate (Hz) | 8000 


Display Data Size 64 R 
DSP Data Type 16-bit signed integer 
Q-value 0 

Sampling Rate (Hz) , 8000 





(a) 时 域 图 特性 对 话 框 (b) 频 域 图 对 话 杠 
图 1.9 工程 sine8_buf 在 CCS 中 Graph Property Dialog 窗口 的 选项 设置 


Build Camplete, 
0 Errors, 0 Warnings. 0 
Mb. bus 





图 1.10 CCS 画 出 的 1 kHz 正弦 波 的 时 域 和 频 域 图 


注意 ， 为 改变 屏幕 大 小 ,在 Build 窗口 点 击 右 键 ， 取消 Allow Docking 的 选项 ， 就 可 在 CCS 
中 得 到 很 多 不 同 的 窗口 
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例 1.3 两 数组 的 点 积 


在 数字 信号 处 理 器 中 ， 像 加 / 喊 和 乘法 运算 部 是 关键 运算 ， 乘法 /累加 运算 更 加 重要 ， 它 在 许 
多 需要 数字 滤波 、 相 关 和 频谱 分 析 的 应 用 中 相当 有 用 。 乘 法 运算 非常 普 注 ， 而 且 是 大 多 数字 信号 
处 理 算法 的 基础 ， 因 此 在 一 个 时 钟 周期 内 执行 乘法 运算 是 很 重要 的 。 使 用 C6x， 实 际 上 可 以 在 一 


个 时 钟 周 期 内 执行 两 次 乘法 /累加 运算 。 


本 例 介绍 CCS 的 其 他 特点 ， 例 如 单 步 执 行 和 对 程序 进行 剖面 分 析 , 测试 各 种 性 能 , 重点 仍然 
是 熟悉 使 用 CCS LR. DH C 编译 优化 器 后 ， 看 看 性 能 和 执行 速度 怎样 才能 显著 提高 。 

C 源 文件 dotp4.c ( 如 图 1.11 所 示 ) 实现 两 个 数组 的 点 积 , 每 个 数组 有 4 个 数 , 头 文件 dotp4.h 
定义 了 这 两 个 数组 ( 见 图 1.12 )。 第 一 个 数组 包含 1, 2, 3, 4 四 个 数 ， 第 二 个 数组 包含 0, 2, 4, 5 四 
个 数 ， 两 个 数组 的 点 积 是 (1 x 中 +Qx2D+(3xD+(4Xx 人 8= 和 0。 








//Dotp4.c Multiplies two arrays, each array with 4 numbers 


int dotpíshort *a, short *b, int ncount); 
#include <stdio.h> 

Kinclude "dotp4.h*" 

Kdefine count 4 
short x[count] = 


short y[count] 


{x_array}; 
(y array): 


mainí] 
{ 
int result = 0; 
result = dotpíx,y,count); 
printfí("result = 
} 
int dotp(short *a, short *b, int ncount) 
{ 
int sum = 0; 
int i; 
for {i = 0; i < neount; i++) 
sum += a[i] * bli]; 
return (sum); 


} 





&d (decimal) Xn", result); 


//function prototype 
//f£or printf 

//data file of numbers 

//* of data in each array 
//declara 1st array 
//declara 2nd array 


//result sum of products 
//call dotp function 
//print result 

//dot product function 


/finit sum 


//8um, of products 
//return sum as result 





图 1.11 求 两 个 数组 点 积 的 C 程序 


//dotpé.h Header file with two arrays of numbers 





#define x array 1,2,3,4 


#define y, array 0,2,4,6 





图 1.12 ”定义 两 个 数组 是 每 个 序列 有 4 个 数 的 头 文件 


这 个 程序 可 以 很 方便 地 修改 ， 以 处 理 更 大 的 数组 ， 因 为 本 例 没有 使 用 实时 实现 ， 因 此 不 需要 
实时 VO 支持 文件 。 这 里 也 不 需要 中 断 支持 文件 ， 用 到 的 矢量 文件 也 不 大 ， 如 图 1.13 所 示 。 
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*YVectors.aga Vector file for non-interrupt driven program 


.title "vectors.asm" 
.ref .c intD0 reference entry address 
.sect "vectors" ;in vector section 

rst: mvki .82 _c_int06,b0 ;lower 16 bits 一 > hod 
mvkh .s2  c.int00,b0 rhigher 16 bits — bd 
b -s2 bd :branch to entry address 
nop :5 NOPs for rest of fetch packet 
nop 
nop 
nop 
nop 


图 113^ 非 中 断 驱动 程序 的 矢量 文件 【vectors asm ) 


创建 和 建立 工程 dopt, AA 1.1 一 样 ， 将 下 面 的 文件 浴 加 到 工程 中 


1 
2 
3. 
4 


. CHIE dotp4.c。 
.和 定义 人 日 地 址 c_int00 的 矢量 文件 vectors.asm。 


连接 命令 文件 c6xdsk.cmd。 


. 库 文件 rts6701.lib。 


因为 可 以 选择 菜单 Project Scan All Dependencies 将 所 需要 的 include 文件 添加 到 工程 的 文件 
严 中 ， 因 此 不 要 使 用 菜单 Add Files to Project。 程 序 dotp4.c 中 使 用 了 printf 语句 打印 结果 ， 因 此 
需要 头 文件 stdio.h。 


在 观察 窗口 设置 观察 变量 


1. 


选择 菜单 Project 一 Options， 进 行 如 下 设置 : 
编译 器 选项 设置 为 -gs; 
连接 器 选项 设置 为 -ec -o  dotp4.out. 


. 选择 三 箭头 的 工具 条 ,执行 Rebuild AH 命令 (或 选择 菜单 Debug— Build )。 | 
， 选 择 菜 单 View Quick Watch, WANA EE sum， 点 击 Add to Watch， 这 时 会 显示 与 sum 


相关 的 一 条 消息 “identifier not found" , 这 是 因为 现在 仍 在 main 函数 中 , 局 部 变量 还 不 存在 。 


， 为 了 在 程序 行 : 


sum += a[i] * bfil; 


设置 断 点 ， 将 鼠标 放 在 该 行 (点 击 )， HUS th NURSE Toggle breakpoint, XXBIREUT f; 
的 左边 应 该 出 现 一 个 回 圈 。 


选择 菜单 Debug 一 Run ( 或 使 用 “跑步 者 ”工具 条 )， 程 序 将 执行 到 设置 断 点 的 行 ， 这 时 


一 个 黄色 箭头 就 会 指向 这 行程 序 。 


. 使 用 FS 键 进行 单 步 执行 (或 使 用 工具 条 )， 继 续 单 步 执行 ， 在 观察 窗口 观察 变量 sum 值 


从 0,4, 16 ZIER] 40。 选 择 菜单 Debug 一 Run， 检 查 打印 的 sum 结果 是 否 为 : 
sum = 40《 十 进 制 ) 
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7. Ho, C 程序 dotp4e 中 使 用 了 打印 结果 的 printf ST, DARA, AAN 
行 这 条 语句 需要 3000 个 时 钟 周期 。 


仿真 

1， 选 择 菜单 Debug-*Reset CPU—File—Reload Progratm， 重 载 执 行文 件 dotp4.out。 

2， 和 前 面 一 样 ， 再 次 在 相同 的 程序 行 设 置 断 点 ， 选 择 菜单 Debug 一 Animate， 通 过 疯 察 窗口 
观察 变量 sum 值 的 变化 。 另 外 ， 通 过 选择 菜单 Option 一 Customize Animate Speed， 可 控 
(0 制 仿 真 的 速度 。 E | 


测试 没有 经 过 优化 的 程序 性 能 “剖面 分 析 ) | 
本 节 介 绍 如 何 将 一 段 程序 代码 作为 测量 基准 ， 例 中 仍 使 用 dotp 函数 , 检查 编译 器 、 连 接着 选 
项 的 设置 是 各 和 以 前 设置 的 一 样 ， 即 编译 器 选项 设置 为 -gs， 连 接 器 选项 设置 为 -c -o dotp4.out。 
为 了 分 析 程 序 各 个 方面 的 性 能 以 及 产生 符号 调试 信息 ， 编 译 器 选项 必须 使 用 -g。 为 了 去 掉 程 
序 行 中 的 断 点 ， 可 右 击 设置 断 点 的 程序 行 ， 再 选择 菜单 Toggle breakpoint， 这 样 就 可 去 掉 程 序 行 
中 的 断 点 。 2 
1. 选择 菜单 Debug 一 Reset CPU—File—Reload Program， 重 载 可 执行 文件 。 
2 选择 菜单 Profiler 一 Start New Session， 在 Profile Session Name 中 输入 dotp4， 然 后 按 王 OK 
TE. 
3. 点 击 Create Profile Area 图 标 ， 即 图 1.14(b) 左 上 起 第 四 个 图 标 , 图 1.14(b) 显 示 了 在 C 源 文 
件 dotp4.c FEIN ABR dotp 的 前 面 分 析 区 。 
4， 运 行程 序 ， 检 查 如 图 1.14{b) 所 示 的 运行 结果 ， 结 果 显 示 执 行 函 数 dow 需要 138 个 时 钟 周 
期 (程序 没有 优化 时 ) . l 


测试 经 过 优化 的 程序 性 能 《剖面 分 析 ) 

本 节 介绍 如 何 用 一 种 优化 选项 -o3 来 优化 程序 ， 通 过 优化 C 编译 器 可 提高 程序 的 运行 速度 。 
选择 菜单 Project Build Qptions， 将 编译 器 选项 设置 改 为 ; 

-g -o3 ' 
连接 器 选项 和 以 前 设置 的 一 样 (也 可 直接 输入 ), 03 选项 调用 最 高 的 编译 优化 方法 . 文献 P9 对 多 
种 编译 器 选项 进行 了 描述 。 使 用 Rebuild AN 功能 ( 带 三 个 箭头 的 工具 条 ) 装载 可 执行 文件 dotp4.out 
( 选择 菜单 File 一 Load Program ). 注意 装载 可 执行 文件 后 , 执行 的 人 口 地 址 是 c_int00, 可 由 反 汇 
| 编 文件 查看 人 口 地 址 。 | 
c 选择 菜单 Debug—Run, RAAT dop 函数 需要 的 时 间 ， 这 时 发 现时 间 从 138 个 时 钟 周期 变 
| 成 了 30 个 时 钟 周期 ， 如 图 1.14(e) 所 示 。 可见 利 用 C 编译 器 优化 方法 ,程序 执行 速度 有 显著 提高 。 
还 可 以 利用 第 3 章 的 内 部 函数 和 第 8 章 的 程序 代码 优化 方法 对 该 点 积 例 程 进行 进一步 优化 。 


1.5 支持 程序 /文件 的 一 些 考虑 


+ 下 面 的 支持 文件 实际 上 可 用 于 本 书 所 有 的 例子 中 : (1) cóxdskinite; (2) vectors_11.asmi 
(3) c6xdsk.cmd。 目 前 的 重点 是 使 用 它们 。 





r 
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Add F 


C \i\inypropects\D otp4\dotp4 







nt result * 0 resuit sus of produc 














function 
print 


call dotp 
result) 


hort sa, short sh int ncount) dot product | 







x o TL J i ncount b 
sum +* &[1] © bli} £u» of products 
turn(sum) return sum as result 


(c) 优化 的 dotp 函数 剖面 分 析 窗口 
图 1.14 工程 dotp4 剖面 分 析 的 CCS 窗口 显示 


1.5.1 初始 化 通信 文件 


C 源 程序 主 程序 中 的 comm. intr 函数 位 于 通信 文件 cóxdskinit.c 中 , 程序 的 部 分 内 容 如 图 1.15 
所 示 。DSK 被 初始 化 ， 然 后 配置 、 启 用 传输 中 断 INT11。 

该 通信 支持 文件 同时 包含 输入 和 输出 两 个 函数 ， 函 数 input. sample 返回 来 自 mcbsp0_read $i 
入 的 数据 ， 而 函数 output. sample 调用 mcbsp0_write 进行 输出 。 


中 断 驱 动 程序 
o. 使 用 中 断 驱 动 程序 , 就 需要 选择 一 个 中 断 ( 这 里 选择 INT11 )， 非 屏蔽 中 断 位 和 全 局 中 断 使 能 
位 (GIE) 一 样 ， 都 要 处 于 使 能 (Enable) 状态 中断 支持 函数 在 支持 文件 c6xdskinterrupts.h 中 ， 
它们 被 文件 c6xdskinitc 中 的 函数 comm intr 所 调用 
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//C6xdskinit.c Partial listing. Init DSK,AD535,McBSP 


#include <c6x.h> 

Kinclude *c6xdsk.h* 
#include *cóxdskinit.h" 
#include "có6xinterrupts.h" 


void mcbsp0_write(int out, data) //function for writing 

{ 

int temp; 

if (polling) //bypass if interrupt-driven 


t 
temp = *(unsigned volatile int *)McBSPO_SPCR & 0x20000; 
while ( temp == 0) 

temp = *(unsigned volatile int *)MCBSPO SPCR & 0x20000; 
} 
*(unsigned volatile int *)McBSPO_DxXR = out data; 


) 

int mcbspO read() //function for reading 

‘int temp; 

if {polling} //bypass if interrupt-driven 


{ 
temp = *(unsigned volatile int *)McBSPO_SPCR & 0x2; 
while { temp == 0) 
temp = *(unsigned volatile int *)McBSPO_SPCR & 0x2; 
} 
temp = *(unsigned volatile int *)McBSPO DRR; 
return temp; 
} 


void comm poll(í) //communication with polling 
{ . 
polling = 1; //setup for polling 
c6x dsk inití); //call init DSK function 
) 
void comm intrí) //communication with interrupt 
1 
polling - 0; //if interrupt-driven 
c6x dsk init(): //call init DSK function 
config Interrupt Selector(11,XINT0); /fusing transmit interrupt INT1 
enableSpecificINT (11); //for specific interrupt 
enableNMI(); //enable NMI 
enableGlobalINT(); //enable GIE global interrupt 
mcbspO write(0); //write to SPO 
} 
void output_sample(int out data) //added function for output 
{ 
mebsp0_write(out_data & Oxfffe}; //mask out LSB 
} 
int input_sample{) //added function for input 
{ 
return mebsp0_read(}; //read from McBSP0 


) 
图 1.15 通信 支持 程序 的 部 分 清单 C cOxdskinitc ) 





20 DSP REAR 已 编 程 开发 技术 


轮 询 型 程序 

轮 询 程序 GERRY) 不 断 查 询 或 检测 发 送 或 接收 数据 是 否 已 准备 好 ， 这 种 方式 没有 
中 肠 型 方式 效率 高 。 在 输入 读 函 数 mcbsp0_read 中 ， 将 串 行 口 控制 寄存 器 ( SPCR ) 的 内 容 和 0x2 
进行 AND 操作 ,用 来 检测 寄存 器 bl 位 的 状态 ( 第 二 个 量 低 有 效 位 )， 如 图 B.8 所 示 ( 见 附 录 B ) 
在 输出 写 函 数 mebsp0_write P, H SPCR 和 0x20000 进行 AND 操作 ， 用 来 检测 bl7 位 的 状态 。 
输 和 数据 通过 堵 通 道 缓冲 串 行 口 (McBSP ) 的 数据 接收 害 存 器 来 接收 ， 输 出 数据 通过 McBSP 的 


数据 发 送 寄 在 器 来 发 送 。 
后 面 的 一 些 例子 采用 轮 询 方式 来 控制 输入 和 输出 数据 速度 ， 但 大 多 教 例子 是 中 断 驱动 型 的 。 
关于 中 斯 将 在 第 3 章 进 行 讨 论 ， 目 前 ，INT11 是 由 串 行 口 (MeBSP ) 产生 的 。 


15.2 ”矢量 文件 


中 斯 服务 程序 ( ISR Xc intl! fF C 程序 ( sine8_intrc 或 sine8_buf.c ) 中 , 为 了 选择 中 断 INT11， 
指向 中 断 服 务 程序 的 分 支 指令 应 该 放 在 vectors_11.asm 文件 中 地 址 INT11 的 下 面 。 文 件 
vectors 11.asm 如 图 1.16 Sta, 注意 调用 的 程序 或 函数 名 前 有 下 划 线 ,在 yectors_11.asm 中 的 ISR 
也 用 .ref c_intil 来 表示 。 

对 于 非 中 断 驱 动 型 矢量 文件 ， 按 照 下 面 的 方法 修改 文件 vectors. 11.asm: 


1， 删 除 中 断 服 务 程序 ,ref_c_jintil 的 交叉 引用 参考 语 名 .ref c int00。. 
2. 对 于 中 断 INT11， 用 NOP 指令 替代 指向 ISR 的 分 支 指令 。 


*Yectors ll.amm Vector file for interrupt-driven program 
.xef .e.intli ISR used in C program 
.ref _c_int00 ;entry address 
.Sect "vectors" ;Section for vectors 

RESET RST: mvkl .82 c int00,B0 lower 16 bits —» BO 
Mvkh -52 . c intÜ00,BO0 :upper 16 bits 一 > BO 
B .52 BO ;branch to entry address 
NOP iNOPS for remainder of FP 
NOP ;to fili 0x20 Bytes 
NOP 
NOE 
NOP 

NMi_RST: .loop 8 

| NOP :fill with 8 NOPs 

.endloop 

RESYL: .loop 8 


.endloop 
INTA: .loop 8 

NOP 

.endloop 
INTS: .loop 8 


-endlcop 
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INT9: .loop 8 
INT10: .loop 8 
INT11: b 0. intll tbranch to ISR 


.endloop 
INT12: .loop 8 
NOP 
.endioop 
INT13: .loop 8 
NOP 
-endloop 
INTI4: -loop 8 


INT1S: .loop 8 


.endloop 


图 1.16 中 断 驱动 矢量 程序 《vectors_11.asm) 








153 ”连接 器 文件 


连接 需 命 令 文件 c6xdsk.cmd 如 图 1.17 BUR, CER T itext 和 .stack 等 常 驻 于 IRAM 的 一 些 
Be, 并 给 出 了 映射 到 C6711 数字 信号 处 理 器 内 存 中 的 状况 。 尽 等 命 令 文件 的 某 些 部 分 是 不 必要 的 ， 
但 它 可 作为 通用 的 连接 命令 文件 模板 。 第 4 章 给 出 了 一 个 使 用 SDRAM 作为 外 部 RAM 的 例子 ， 
其 起 始 地 址 为 0x80000000。 


L6 ”编译 器 /汇编 器 /连接 器 的 Shell 程序 


在 前 面 的 例子 中 ， 当 建立 一 个 工程 时 , 就 会 调用 CCS 中 进行 编译 、 汇编 和 连接 的 程序 代码 生 
成 工具 ， 这 些 工具 也 可 以 在 CCS 外 用 DOS shell 程序 直接 调用 。 


1.6.1 编译 器 
编译 器 Shell 程序 可 用 下 面 命 令 行 调用 : 


Cl6x [options] [files] 


这 条 命令 可 对 扩展 名 为 .c 的 C 文件 、 扩 展 名 为 .asm 的 汇编 文件 和 扩展 名 为 .sa 的 线性 汇编 (第 3 章 
中 将 介绍 ) 进行 汇编 和 编译 。 线 性 汇编 程序 文件 是 C 和 汇编 的 “中 间 产 物 "， 它 实现 了 C 程序 的 
通用 性 和 汇编 程序 的 高 效 性 之 间 的 折 中 。 例 如 ， 


Cl6x -gks -o3 filel.c, file2, file3.asm, filed.sa 
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/*C6xdmk.cmd Generic Linker command file*/ 


MEMORY 

VECS: org - Oh, len = 0x220 /*vector section*/ 
IRAM: org = 0x00000220, len = Ox0000FDCO /*internal memory*/ 
SDRAM: org = Ox80000000, len = 0x01000000 /*external memory*/ 
FLASH: org = 0x90000000, len = 0x00020000 /*flash memory*/ 

H . 

SECTIONS 

{ 
vactors VECS 
text IRAM 
-bss IRAM 
-cinit IRAM 
.Stack 
.SySsImem SDRAM 


„const 
-switch 
. far 
.Cin 


VRVV VY YN YY 
: 





图 1.17 通用 连接 器 命令 文件 (cbxdskcmd ) 


上 面 的 命令 将 调用 C 编译 器 对 filel 和 file2 (上 默认 扩展 名 为 .c ) 进行 编译 ， 并 生成 汇编 文件 
filel.asm 和 file2.asm， 同 时 调用 汇编 器 优化 程序 对 file4.sa 进行 优化 ， 生 成 文件 合 e4.asm， 然 后 汇 
编辑 (用 Shell 命令 cl6x 调用 ) 汇编 这 4 个 汇编 源 文件 并 生成 目标 文件 血 el.obj, …, filed.obj. 3t 
项 设置 为 -gs， 分 别 用 于 在 调试 中 获得 特定 的 调试 信息 和 将 C 语句 与 汇编 文件 交叉 列 出 来 ， 选 项 
设置 -kk 用 于 保留 生 成 的 汇编 源 程序 。 

有 4 种 级 别 的 编译 器 优化 选择 方案 ，-o3 调用 最 高 的 优化 级 别 ; 0 级 优化 给 变量 分 配 寄存 器 ， 
1 级 优化 兼 有 0 级 优化 的 所 有 功能 ， 并 能 去 掉 局 部 的 公共 表达 式 和 没有 用 的 赋值 语句 ;2 级 优化 
FEAT 1 级 优化 功能 并 对 循环 和 滚动 (Rolling) 进行 优化 将 在 后 面 讨论 ; 了 级 优化 具有 所 有 
2 级 优化 功能 ， 并 去 除 未 调用 的 函数 。 另 外 还 有 使 程序 代码 最 短 的 编译 句 优 化 方案 这 种 优化 方 
案 可 能 会 引起 程序 代码 执行 速度 下 降 )。 

注意 ， 完 全 优化 方案 可 能 会 改变 存储 器 单元 的 分 配 , 这 样 可 能 影响 程序 的 功能 。 这 种 情况 下 。 
必须 声明 这 些 存储 器 单元 是 易 变 的 。 编 译 器 对 易 变 变量 不 进行 优化 且 将 易 变 变量 分 生 到 未 初始 化 
的 段 中 ， 而 不 是 寄存 器 中 。 当 存储 器 访问 方式 在 C 代码 中 指明 时 ， 可 以 使 用 易 变 变量 。 

在 开始 优化 时 ， 首 先 关注 的 是 程序 的 功能 。 在 开始 调试 时 ， 不 要 调用 任何 【或 太 高 的 》 优化 
选项 ， 因 为 提供 的 一 些 附 加 特定 调试 信息 将 加 人 快 调试 过 程 ， 这 些 附加 信息 会 影响 程序 的 性 能 。 在 
程序 进行 优化 后 ， 很 玲 对 各 序 进行 滑 坛 , 因为 各 序 行 并 不 是 按 首 党 的 顺序 组 织 的 。 在 进行 编译 时 ， 
也 可 以 用 C. OPTION 环境 变量 设置 编译 器 选项 。 


1.6.2 汇编 器 
汇编 文件 file3.asm 也 可 以 用 下 面 命令 进行 汇编 ， 
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asm6x file3.asm 
经 汇编 后 ， 生 成 目标 文件 fle3.obj。 扩 展 名 .asm 是 可 选 的 ， 生 成 的 目标 文件 必须 和 实时 运行 支持 
库 相 连接 ， 生 成 扩展 名 为 .out 的 可 执行 公共 目标 文件 格式 (COFF )， 这 种 格式 文件 可 直接 装载 到 
数字 信号 处 理 器 中 运行 。 


1.6.3 ”连接 器 

连接 器 可 用 下 面 谨 句 进行 调用 ; 

lnkéx -c progl.obj -o progl.out -1 rts6701.1ib 
选项 -~c 通知 连 楼 器 在 运行 时 , HI C 环境 定义 规则 对 变量 进行 自 动 初始 化 ( 另 一 个 连接 器 选项 是 
-cr， 表 示 在 装载 时 对 变量 进行 初始 化 )。 选 项 -1 表示 调用 运行 支持 库 文件 rs6701.i， 当 连接 时 ， 
必须 使 用 这 些 选 项 ( -ef-er 和 -1) 目标 文件 progl.obj 和 库 文件 进行 连接 ,生成 可 执行 交 件 progl.out。 
如 果 不 使 用 -o 选项 ， 就 生成 名 为 aon ( 默认 文件 各 ) 的 可 执行 文件 。 

连接 器 也 可 以 用 带 -z 选项 的 编译 命令 来 调用 : 

Cl6x -gks -03 progl.c prog2. asm ~ -o prog. out -m prog. map 

-1 rts6701.1ib 
使 用 上 述 命令 ,生成 可 执行 文件 prog.out。 选 择 选 项 -m 会 生成 映射 文件 ， 该 文件 列 出 所 有 朋 、 符 
号 和 标号 地 址 ， 对 调试 程序 非常 有 用 。 

连接 器 选项 -heap size 指定 用 于 动态 存储 分 配 ， 并 按 字 节 计算 堆 的 大 小 《默认 是 1 kB), 选项 
-stack size 则 用 于 指定 C 系统 的 堆栈 大 小 ( 单位 是 字 节 )， 其 他 连接 器 选项 可 参见 文献 24。 

连接 器 使 用 睦 认 的 存储 单元 分 配 算法 将 程序 分 配 到 存储 器 中 , 它 将 不 同 的 段 旋 到 合适 的 存储 
区 中 , 这 些 存储 区 中 存放 程序 代码 和 数据 。 使 用 扩展 名 为 .cmd BEB OE, 可 以 使 在 储 器 
按照 用 户 的 要 求 进行 分 配 ， 在 命令 文件 中 用 MEMORY 和 SECTIONS 指令 说 明 。 连 接 器 指令 
MEMORY ( 大 写 ) 定义 了 存储 器 模式 ， 并 指定 多 个 可 用 的 存储 器 空间 的 起 始 地 址 和 长 度 。 连接 指 
4 SECTIONS (KS ) HEIR i BEA RE OEE e PRR RIDERA RORIS] FR 
存储 器 空间 中 。 

图 1.17 给 出 了 连接 程序 命令 文件 模板 文件 ， 该 文件 几乎 可 用 于 本 书 中 的 所 有 例子 。 我 们 将 使 
用 内 部 存储 器 (IRAM ) 来 存储 代码 和 数据 段 。 在 第 4 章 中 ,我 们 将 说 明 用 外 部 存储 器 ( SDRAM ) 
来 实现 数字 滤波 器 。 外 部 程序 存储 器 的 起 始 地 址 为 0x80000000， 长 度 为 0xl1000000， a 16 MB, 
(NFF < Flash ) 地 址 从 0x90000000.3F 23, 4 BEA 0x20000, E} 128 kB. ZEE 

当 使 用 C 程序 来 初始 化 运行 环境 时 , 设置 入 口 为 c_ int00, 连接 程序 将 自动 和 boot: 进行 连 
接 。 当 使 用 连接 器 选项 -c ( 或 -cr ) 时 ， 连 接 器 将 自动 定义 ec_int00 符号 ， 包含 在 运行 支持 库 中 的 
函数 _c_int00 是 bootobj 的 入 口 ，boot.obj 文件 建立 堆栈 并 调用 主 函数 。 运行 库 支 持 程序 boot.c 对 
变量 进行 自动 初始 化 ， 连 接 器 选项 -< 将 使 用 boot.c 进行 初始 化 过 程 。 注 意 c_int00 是 在 矢量 文件 
vectors_11.asm 和 vectors.asm Pe YAS, k 
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本 章 主要 介绍 利用 DSK HEM ADS35 编 解码 器 进行 输入 输出 《附录 F PATI AHN 
PCM3003 -t ls AES RERET A A un ITE), SEAE C 语言 编程 实例 。 ” 


21 引言 - 


DSP- 技 术 典 型 应 用 的 最 基本 系统 如 图 Z1 所 示 ， 它 包括 模 氛 输入 和 输出 。 在 输入 端 有 一 个 抗 
混用 滤波 器 ， 用 来 江 除 信号 中 高 于 奈 牵 斯 特 频率 ( Nyquist frequency ) 的 部 分 。 REAR EL 
为 抽样 频率 五 的 二 半 RSPR TREAT EER 这 时 频率 高 于 Fy2 的 
信号 和 频率 较 低 的 信号 将 产生 混合 现象 。 为 了 避免 频率 混 秋 现 象 ， 抽样 定理 赛 求 抽样 频率 最 小 必 
须 是 信号 中 最 高 频率 分 量 了 的 两 倍 ， 妈 : 


-Es2f ` 
ws 
/Es > 2 AT). 
RET, 是 抽样 周期 RESM: 
T, «TÍ2 


即 抽样 周期 必须 小 于 信号 周期 的 一 半 。 例 如 ， 人 耳 听 不 见 20 kHz 以 上 的 频率 信号 ， 则 可 在 输 
人 端 使 用 一 个 带宽 或 截止 频率 为 20 kHz 低 通 滤波 器 先进 行 福 波 ， 去 掉 20 KHz 以 上 的 频率 分 量 以 
避免 频率 混合 ， 然 后 使 用 大 于 40 kHz 的 抽样 频率 瑟 来 抽样 音乐 信号 (抽样 频率 通常 为 44.1 kHz 
或 48 kHz ), 图 22 表示 了 有 混 香 现象 的 信号 ,假设 抽样 频率 下 是 4 kHz, 即 抽样 周期 二 是 0.25 ms, 
这 时 就 不 能 仅 通 过 (0, 1, 0, -1) 一 系列 抽样 点 来 判断 它 是 1 kHz 信号 还 是 5 kHz 的 信号 。5 kHz 
的 信号 看 起 来 像 1 kHz 的 信号 ， 因 此 1 kHz 信号 是 一 个 混 秋 信号， 同样 9 kHz 信和 号 也 是 1 kHz 入 
号 的 混 秋 信和 号 。 


图 2.1 具有 输入 输出 的 DSP 系统 
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时 间 (ms) 
PA 2.2 有 频率 泥 革 现象 的 正弦 信号 


2.2 ”利用 TLC320AD535 编 解码 器 输入 输出 


fr DSK 板 上 有 一 个 TLC320AD535 ( AD535 ) 编 解码 器 ,可 用 于 输入 输出 信号 。 编 解码 器 的 
ADC 电路 将 输入 的 模拟 信号 转换 成 能 被 DSP 处 理 的 数字 信号 。 输 人 信和 号 的 最 大 电 平 值 由 编 解 码 
器 特定 的 ADC 电路 决定 ，DSK 板 上 编 解码 器 输 人 的 蜂 - 峰 值 是 3V。 当 输入 信号 处 理 完 后 ， 结 果 
要 输出 到 外 部 。 如 图 2.1 所 示 ， 在 输出 端 有 一 个 DAC， 它 与 ADC 的 作用 正好 相反 ， 输 出 滤波 器 
用 来 平滑 和 重建 信号 , ADC. DAC 和 所 需要 的 滤波 功能 都 由 DSK 板 上 的 编 解 码 器 AD535 单个 区 
片 来 实现 。 

AD535 是 一 个 基于 sigma-delta 技术 的 双 通 道 话 音 /数据 编 解码 器 413， 具 有 ADC, DAC, (GH 
滤波 、 过 抽样 等 功能 。AD535 编 解 码 器 有 两 个 通道 ， 抽 样 频率 达 11.025 kHz, (H DSK 板 上 的 编 
解码 器 只 有 一 个 输入 和 一 个 输出 可 供用 户 使 用 ， 用 户 可 方便 地 利用 两 个 3.5 mm 音频 电缆 连接 头 连 
接 输 人 输出 端 ， 抽 样 频率 固定 在 8 kHz 而 不 是 11.025 kHz", 

sigma-delta 转换 器 使 用 较 低 的 抽样 频率 , 但 利用 过 抽样 技术 实现 了 较 高 的 分 辩 率 ,这 种 ADC 
属于 抽样 频率 比 奈 杜 斯 特 频 率 高 很 多 的 一 种 ADC. DSK 板 上 的 ADS35 编 解码 器 的 过 抽样 因子 
是 多， 用 数字 插值 滤波 器 完成 过 抽样 的 功能 。 在 这 类 器 件 中 , 量化 噪声 功率 和 抽样 频 率 是 相对 独 
立 的 ， 其 中 调制 器 起 到 了 噪声 成 形 的 作用 ， 使 噪声 扩展 到 超出 所 关心 的 冰 率 范围 之 外 。 噪声 功率 
谱 分 布 在 0 到 FJ2 之 癌 ， 因 此 只 有 很 小 一 部 分 噪声 落 在 信号 频带 范围 内 。 另 外 ， 还 采用 了 数字 滤 
波 器 去 除 带 外 噪声 。 

ADC 将 输入 信号 转换 成 不 连续 的 输出 数据 , 这 些 数 据 用 二 进 制 补 码 表示 ， 对 应 模拟 信号 相应 
时 刻 的 抽样 值 。 DAC 中 有 插值 滤波 器 和 数字 调制 器 ,抽取 滤波 器 将 数字 信号 的 速率 降低 到 与 抽样 
速率 一 致 ， 然后 ，DAC 的 输出 信号 通过 内 部 低 通 重建 滤波 器 ， 最 后 得 到 模拟 输出 信号 。 通 过 使 用 
sigma-delta 调制 器 提供 的 噪声 成 形 与 过 抽样 技术 ， 就 可 实现 ADC M DAC REHE RE, 

抽样 频率 F, 是 通过 编 和解 码 器 上 频率 为 4096 kHz 的 主 时 钟 MCLK 设 定 的 ， 如 下 所 示 ， 

F, - MCLK/512 =8 kHz 


图 2.3 显示 了 AD535 和 C6711 DSK 的 接口 框图 ， 它 包含 在 CCS 软件 包 中 。 
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接口 之 间 利 用 串 行 方法 进行 通信 ， 使 用 同一 个 串 行 口 实现 数据 传输 及 传输 控制 ， 前 者 是 主要 
的 通信 功能 ， 后 者 是 次 要 的 通信 功能 ，D/A 数据 寄存 器 的 最 低 有 效 位 用 于 传输 控制 请 求 功能 。 


2.3 利用 PCM3003 立体 声 编 解 码 器 输入 输出 


附录 FM 介绍 了 基于 PCM3003 立体 声 编 解码 器 的 音频 子 板 ， 图 2.4(a) 显 示 的 是 这 种 音频 子 板 
的 照片 ， 它 的 外 形 尺 寸 是 3x3.5 英寸 "。 

图 2.4(b) 是 PCM3003 编 解码 器 的 方 框图 。 这 块 子 板 的 原理 图 在 附录 下 中 , 可 以 将 该 子 板 插 到 
DSK 板 上 的 80 脚 插头 上 。PCM3003 有 两 条 完整 的 输入 输出 通道 ， 其 抽样 率 可 编程 控制 ， 最 大 抽 
样 频率 是 72 kHz CTI 公司 建议 最 大 抽样 率 是 48 kHz )。 附 录 F 中 有 几 个 例子 用 来 说 明 如 何 使 用 
PCM3003 的 输入 输出 通道 





串 行 接口 与 
模式 控制 






(b) PCM3003 编 解码 器 的 方 框图 
图 2.4 PCM3003 编 解码 器 


2.4 C 程序 编程 实例 


下 面 一 些 例子 介绍 使 用 DSK 进行 输入 输出 。 通 过 学 习 这 些 例子 ， 可 更 加 熟悉 使 用 硬件 和 软 
fF, 还 可 了 解 一 些 特定 的 应 用 背景 。 例 如 ， 在 工程 例子 sine2sliders H, 说 明了 如 何 使 用 两 个 滑动 
条 ; 回声 的 例子 介绍 了 改变 缓存 器 长 度 对 回声 的 影响 ， 另 一 个 回声 例子 则 介绍 了 如 何 使 用 两 个 中 
断 ; 方 波 产生 的 例子 介绍 了 怎样 产生 方 波 并 解释 了 AD535 如 何 将 数据 转换 为 对 应 的 输出 电压 。 


例 2.1 使 用 中 断 的 循环 程序 


本 例 介 绍 如 何 使 用 AD535 进行 输入 输出 , 图 2.5 是 C 源 程序 loop. intrc, 它 是 一 个 循环 程序 
与 例 1.1 相同 ， 它 使 用 中 断 INT11 作为 中 断 源 。 


(D 1 英寸 =2.54 cm 一 一 编者 注 
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//Loop intr.c Loop program using interrupt, output is delayed input 
/fComm routines and support files included in Cóxdskinit.c 


interrupt void c intil() _ |. Ffinterrupt service routine 
{ 
int sample_data; 


sample data = input | sample(); //input data 
output. sample (sample, data); //output data 
return: 

} 


void main() 
{ 


com» intr();. 7 . " o f/ibit ‘DSK, ‘codec, MoBSP 
while(1); “* - coo . (o infinite: oop 


} 





| "Bias 人 用 中 新 的 手术 到 (oop ine) 

该 程序 很 重要 , 因为 可 放 它 作为 编 竺 其 他 程序 的 基础 “gain, -为 了 实现 数字 滤波 器 ， 在 输 人 
和 输出 函数 之 间 必 须 加 入 道 当 的 粤 法 > AH BR. input_sarple 和 output sample, DUX 
comm, intr 函数 都 包含 在 通信 支持 文件 . .e6xdskinft.c P, 这 样 做 可 使 C . 汰 程序 尽 可 能 小 。 文 件 
c6xdskinit.c 可 当做 一 个 ‘ESR’, 本 书 中 的 大 部 分 鱼子 都 用 到 了 它 。 

在 完成 初始 化 以 及 中 断 选 择 / 户 用 使 能 后 ， 狼 行 while 无 恨 御 环 语 钙 ， 直 到 中 断 发 生 。 中 断 响 
应 后 ， 开 始 执行 中 断 服务 程序 (BR ) c_inti1， 该 程序 是 在 矢量 文件 vectors 11.asm 中 指定 的 。 每 
个 抽样 周期 产生 一 次 中 断 ， RET, =01/F, = 1/(8 kHz) =0.125 ms。 这 时 , 从 编 解 码 器 ADC 
读 人 抽样 值 ， 然 后 从 编 解 码 器 DAC 输出 信和 号。 

执行 从 中 断 返 加 到 while(D 语 句 ， 等 待 下 一 次 中 断 的 到 来 。 注 意 可 用 处 理 程序 蔡 换 无 穷 循 环 
while() 的 等 待 。 中 断 响 应 后 ， 开始 执行 中 断 服务 程序 ， 执行 ISR 指定 的 必要 任务 , 然后 返回 正在 
调用 的 消 数 ， 等 待 下 一 次 中 断 的 发 生 。 


1， 在 函数 output sample 中 ， 输 出 数据 的 最 低 有 效 位 被 屏蔽 掉 ， 用 于 次 要 的 通信 和 传输 。 纺 
解码 器 AD535 的 DAC 是 一 个 有 15 位 有 效 位 的 器 件 ,因此 它 使 用 16 位 字 的 最 高 15 个 有 
效 位 作为 输出 数据 ， 最 低 有 效 位 (LSB) 用 于 控制 功能 。 在 函数 outpat_sample 中 ，16 位 
输出 数据 的 最 低 有 效 位 被 屏蔽 掉 ， 通 知 编 解 码 器 不 必 等 竺 后 面 的 控制 数据 。 

2. 在 通 数 comm_int 中 .执行 了 下 面 的 任务 ， — 

(a) BYE DSK, — 

(b) 配置 /选择 INT11 和 传输 中 断 XINTO. 
(c) 使 能 指定 中 断 。 

(d) 使 能 全 局 中 断 位 (《GIE) 

(e) 访问 多 通道 缓冲 串 行 口 CMcBSP) 0。 


被 调用 执行 上 述 任务 的 中 断 函 数 包 售 在 CCS 的 cóxinterrupts.h 文件 中 。 
创建 并 建立 名 为 loop intr 的 工程 ， 使 用 与 例 1.1 相同 的 支持 文件 。 辅 助 材料 中 包含 了 本 书 所 
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有 的 源 文件 和 支持 文件 ,其 他 需要 的 支持 文件 也 包含 在 CCS "Fa IN 连接 头 J7 输 和 人 一 个 正弦 波 ， 
其 振幅 大 约 是 1-2 V (R-E) 频率 大 约 是 1~3 kHz， 连 接 DSK 输出 OUT 连接 头 J6， 可 以 观 
察 到 与 输入 相同 频率 的 单 音 ， 只 是 振幅 有 些 减 小 。 使 用 示波器 观察 ， 可 以 发 现 输出 波形 相对 输 人 
波形 有 些 延 迟 。 将 输入 正 弱 波 的 幅度 超出 3V ( 蜂 - 峰 值 ) 以 上 ， 观 察 到 波形 开始 失真 了 。 


例 2.2 使 用 轮 诲 的 循环 程序 
本 例 使 用 轮 询 方式 实现 每 个 抽样 周期 也 输入 和 输出 样 点 的 循环 程序 ,而 例 2.1 程序 loop_intre 
是 中 断 驱 动 程序 ， 这 里 CHF ljoop_polLc (如 图 2.6 所 示 ) 实现 了 该 轮 询 循环 程序 。 轮 询 技术 连 
| 续 不 断 地 测试 什么 时 候 数据 已 准备 好 。 和 中 断 技术 相 比 ， 它 虽然 比较 简单 ， 但 效率 不 是 很 高 。 


//loop poll.c Loop program using polling, output is delayed input 
//Comm routines and support files included in C6xdskinit.c 


void main() 
1 
int sample data; 


comm pollí); //init DSK, codec, McBSP 
whiie(l) /finfinite loop 
{ 


output_sample (sample data): //output sample 
} l - 


sample data = input_sample(); //input sample 
} 





图 2.6 使 用 轮 询 揭 循环 程序 (loop poll.c Y 


1. 在 函数 input sample 中 ， 调 用 另 一 个 函数 mcbsp0_read， 它 读 取 输入 到 ADC 的 数据 ， 这 
些 数据 来 自 密 通道 缓冲 串 行 口 (MecBSP ) 0， 或 简称 为 SPO 的 数据 接收 寄存 器 (DRR )。 
串 行 口 控制 寄存 器 【SPCR ) 首先 与 0x2 进行 AND 操作 ， 测 试 SPCR 的 接收 准备 寄存 器 
(RRDY ) 位 1 是 否 置 位 ， 如 图 B.8 所 示 。 
2. 在 函数 output_sample 中 , 调用 另 一 个 函数 mcbsp0_write, 把 从 DAC 的 输出 写 人 到 McBSP 0 
(SPO) 的 数据 传送 寄存 器 ( DXR )。SPCR 首先 和 0x20000 进行 AND 操作 ， 测 试 SPCR 
发 送 淮 备 寄存 器 ( XRDY ) 位 17 是 否 置 位 。 程 序 在 无 限 循环 while(1) 中 等 待 数 据 准备 好 ， 
再 开始 执行 输出 ， 


除了 矢量 文件 vectors_ll.asm 外 ,其 他 支持 文件 和 例 2.1 或 例 1.1 都 相同 , BI EISE vectors, 11.asm 
(使 用 INT11 ) 替换 为 vectors.asm ( 在 辅助 材料 中 )， 或 按 如 下 方法 编辑 文件 vectors 11.asm: 


-删除 ref_c_intll 语句 ， 这 是 汇编 器 命令 ， 它 交叉 引用 中 断 服务 程序 (ISR) _e_intll。 在 
函数 前 面 的 第 一 个 下 划 线 是 C 函数 约定 的 规则 。 

.2. 用 NOP ( 空 指令 ) 替换 指令 b c intll, 这 条 指令 原来 指向 ISR, 

创建 并 建立 工程 loop poll， 使 用 例 2.1 同样 的 输入， 检验 输出 结果 是 否 一 致 。 


例 2.3 ”和 使 用 轮 询 方 式 产生 正弦 信号 
本 例 利用 4 个 数据 点 产生 正 骇 波形， 进一步 介绍 轮 询 方法 的 使 用 。 图 2.7 给 出 了 利用 4 个 点 
产生 正弦 波 的 C 源 程序 sine4_poll.c。 
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//Sine4 poll.c Sine generation using 4 points; £=Fs/(# points)=2 kHz 


int loop = Q0; "n : 
short sine tableí4] = (0,1000,0,-1000]; //8ine values 
short amplitude - 1; //for slider 


void mainí) 
{ 
int sample, data; 


comm pollí); J//init DSK, codec, McBSP 


whiletl) //infinite loop 

{ 

sample data = (sine table[loopl*amplitude);  //scaled value 

output sampleí(sample data); //output sine value 

if (loop < 3) -«4loop: /finerement index 

else loop = 0; //reinit @ end of buffer 


Poen 
} 


图 2.7 FFE A 4 MAGRA EERE ( sined_poll.c ) 


使 用 和 例 2.2( 同样 可 参见 例 1.1) 中 loop. poll 同样 的 支持 文件 ， 在 每 个 抽样 周期 T; = UF, , 
输出 由 缓冲 区 ( 表 ) sine, table 的 数据 组 成 ， 数 据 为 0, 1000, D, -1000, 0, 1000, ---, 48K 0.125 ms 
输出 一 个 。 

建立 并 运行 工程 sine4. poll ,检验 输出 是 否 是 偏 秆 为 1 VV, 频率 为 f= FS = 8 kHz4 = 2 kHz 
的 正弦 波形 ， 产 生 仿 置 是 由 于 AD535 编 解 码 器 自身 特点 。 

装载 GEL 文件 sine4_poll.gel 如 图 2.8 所 示 )， 和 例 1.1 一 样 ， 访 问 滑动 条 画 数 amplitude, 
把 滑动 条 从 位 置 1 变 到 位 置 2,3,…, 10， 并 检验 输出 波形 信号 幅度 是 否 增加 了 。 


f*Sine4 poll.gel Create slider and vary amplitude of sine wavat/ 
menuitem "Sine Amplitude" 


slider Amplitude (1,10,1,1,amplitudeparameter) /*incr by l,up to 10*/ 
{ 

amplitude = amplitudeparameter; /*vary amplitude of sine*/ 
) : . 





图 2.8 说 明 滑 动 条 函 教 的 GEL 文件 【sine4_pollLgeI) 


将 滑动 条 函数 amplitude 变化 范围 改 成 30 到 90 (FUR 10), 每 次 步 进 值 仍 为 1， 编辑 GEL X 
ft, 把 它 存 到 sined polga Xft. ERREF, 并 通过 GEL WAE, 当 滑 动 条 的 位 置 在 32 时 ， 
输出 2.7 V. CEERI), SCIRE TE 2 (859432 000 和 -32 000。 将 滑动 条 的 位 置 调 高 到 
33,34, …, 65。 观 察 到 当 消 动 条 在 位 置 65 时 , 输出 信号 幅度 降 到 大 约 为 0.1 V( 峰 -峰值 )， 当 滑动 
ATUY e 66,67, … 90 Ff, RRM MES AS Brie in? 


i246 用 两 个 滑动 条 控制 幅度 和 频率 ， 产 生 正弦 信和 号 
程序 sine2sliders.c ( 如 图 2.9 所 示 ) FARAD EE A PEER ES, 它 利用 两 
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个 滑动 条 分 别 改 变 正 弦 波 的 幅度 和 频率 ， 并 利用 . 32 点 的 查找 表 ， 通 过 每 个 周期 选择 不 同 数 目的 
数据 点 数 来 实现 频率 的 改变 。 幅 度 滑 动 条 用 来 改变 输出 信号 的 幅度 ， 图 2.10 给 出 了 合适 的 GEL 
文件 sine2sliders.gel。 





//Binezgelidera.c Sine generation with different # of points 


short loop = 0; 

short sine_table[(32]={0,195,383,556, 707,831, 924,981,1000, 
$9861, 924,831,707,556,383,195, 
0,-195,-383,-556,-707,-831,-924,-981,-1000, 
-981,-924,-831,-707,-556,-383,-195); // sine data 


short amplitude = 1; //for slider 

short frequency = 2; //for slider 

void mainí) 

1 

comm pollí); ffinit DSK, codec, McBSP 
while(l) /finfinite loop 


{ 
output, sample(sine table[loopl*amplitude); //output scaled value 


loop += frequency; /fincr frequency index 
loop = loop % 32; //modulo 32 to reset 
) 

} 


图 2.9 用 两 个 滑动 条 控制 幅度 和 频率 ， 并 产生 正弦 波 的 程序 ( sine2sliders.c ) 


/*Bineasliders.gel Two sliders to vary amplitude and frequency*/ 
menuitem "Sine Parameters" 


slider Amplitude(1,8,1,1,amplitudeparameter) /*incr by 1,up to 8*/ 
{ 
amplitude = amplitudeparameter; /*vary amplitude*/ 
) 


slider Frequency(2,8,2,2,frequencyparameter) /*incr by 2,up to B8*/ 
{ 

frequency = frequencyparameter; /*vary frequency*/ 

) l l 


2.0 BERE S E BERUSCRISEITHR SH AR RC GEL 文件 ( sine2sliders.gel ) 


Be Pe ea AE IX rn B 32 TC DL BIT YF sin( , BL r4 912 0, 11.25, 22.5, 33.75, 45,--., 348.75 
度 的 值 ( 这 些 值 再 和 1000 相 乘 }， 频 率 滑 动 条 位 置 从 2 变 到 8， 步 长 是 2。 BUM T NL 
TSH [a TE SERERE IP Dk BR E HE A. “SEAS 32 时 ， 就 被 重新 初始 化 为 0。 例 
如 ， 当 频率 滑动 条 在 位 置 2 时， 循环 或 频率 变量 在 查找 表 中 每 隔 一 个 数据 步 进 一 次 ， 这 样 每 个 周 
期 对 应 16 个 数据 点 。 

建立 工程 sine2sliders， 使 用 和 例 2.3 同样 的 支持 文件 ， 检 验 产 生 的 信号 疾 率 是 否 为 f = F/16 = 
500 Hz. 将 滑动 条 的 位 置 分 别提 高 到 4, 6 和 8, 检验 产生 的 信号 频率 是 否 分 别 为 1000 Hz, 1500 Hz 
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和 2000 Hz. ER BALE 4 BF, DRA EA EE PPR PYERE 8 个 数据 ( 每 个 周期 ): 
sinf0], sin[4], sinI8], ---, sinf28]， 对 应 的 数据 分 别 为 0. 707, 1000, 707, 0, —707, -1000 和 -707， 产生 
信和 号 的 频率 为 f= F/8 =1kHz 《和 例 1. 1 一样 )。 


例 2.5 将 输入 数据 仓储 在 级) 中 区 的 循环 程序 - 

程序 loop_store.c《 如 图 2.11 所 示 ) 是 基于 中 断 的 程序 ， 中 断 源 INT11 每 产生 一 次 中 断 ， 就 
从 编 解码 器 的 ADC 和 DAC 读 人 和 输出 一 个 抽样 值 , 另外 , 每 个 抽样 值 被 写 到 512 个 元 素 的 循环 
缓冲 区 中 ， 该 德 环 缓冲 区 用 数组 缓冲 区 来 实现 ， 其 索引 变量 随 存储 抽样 值 的 增加 而 增加 。 当 索引 
变量 增加 到 512 时 ， 它 重新 复位 为 0， 因 此 ， 该 数组 总 是 只 含有 512 个 最 近 抽 样 值 。 


//Loop mtore.c Data acquisition. Input data also stored in buffer 


#define BUFFER SIZE 512 //fbuffer size 

short buffer[BUFFER SIZE]; //buffer buffer 

short i - 0; 

interrupt void e intl1() //interrupt service routine 


i 
int sample, data; 


sample data - input sample(); //new input data 

output sampleí(sample data); //output data 

buffer[i] = sample, data; //store data in buffer 

i++; .. //increment buffer index 

if (i == BUFFER SIZE) i = 0; //reinit index if buffer full. - 
return; //return from ISR 


} 


void main() 

( 

comm intrí); '. #fanit. DSK, codec, McBSP - 
while(1); //intnite loop 

) 





图 2.11 在 存储 器 中 输入/ 答 出 数据 的 循环 程序 (loop. store e ) 


建立 名 为 loop_store 的 工程 ， 输入 幅度 大 约 为 0.5V Cik- 峰值 )、 频 率 为 1 kHz ERRE, 
运行 并 检验 输出 结果 。 

用 CCS 画 出 输入 数据 波形 , 包括 时 域 和 频 域 图 ( 参见 例 12); 选择 菜单 View Graph Time 
‘Frequency, Hi buffer 作为 起 始 地 址 。 为 了 获得 清晰 的 图 形 , 选择 显示 数据 的 个 数 为 128 个 点 (而 
不 是 512 点 ) 如 图 2.12(a) 的 Graph Property Dialog 窗口 所 示 ( 其 他 的 选项 为 默认 值 ), 检查 用 CCS 
夯 出 的 1 kHz 正弦 时 域 波形 ， 如 图 2.12(b) 上 所 示 。 

用 鼠标 右 击 图 形 窗 口 ,或 再 选择 菜单 View 一 Graph*Time/Frequency, 在 Graph Property Dialog 

窗口 选择 显示 类 型 FFT magnitude, SN 2.12(c) 所 示 ， 得 到 输入 数据 频 域 图 形 。 注 音 FFT 的 阶 数 
M=9, 因为 2*=512。 在 图 2.12(d) 中 ，1 kHz 处 的 脉冲 表示 1 kHz 的 正弦 波形 。 
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Display Type Single Time 


Graph Title Graphical Display 
Start Addres buffer 
a 512 


Display Data Size 128 

DSP Data Type 16-b!t signed integer 
Jvalue 0 

Sampling Rate (Hz) 8000 





(b) 表示 1 kHz 信号 的 存储 输出 数据 时 域 图 


DisplayType — — | FFT Magnitude 
Graph Title Graphical Displey 
Signal Type | Real 

Start Address | buffer 

Acquisition Butfer Size 512 

Index Increment j1 

FFT Framesize |512 


FFT Order ;3 

FFT Windowing Func: Rectangle 

Display Peak and Hc! Off H$ 
| 16-bit signed integer 





(c) FFT 幅度 图 的 参数 设置 图 (d) 表示 1 kHz 正弦 信号 的 存 
储 输出 数据 FFT 幅度 图 


图 2.12 程序 loop_store 的 CCS 图 


102.6 将 缓冲 区 的 数据 打印 到 文件 的 循环 程序 

本 例 扩展 了 前 面 的 循环 程序 , 将 存储 缓冲 区 中 的 输入 输出 数据 打印 到 文件 中 , 图 2.13 给 出 了 
实现 该 工程 例子 的 C 源 程序 loop_printc。 在 程序 中 , 执行 printf 语句 需要 很 长 时 间 ( 4000 个 时 钟 
周期 量 级 )， 而 使 用 实时 数据 传送 ( RTDX ) 可 减少 到 30 个 时 钟 周期 ， 附 录 G 对 此 进行 了 介绍 。 

完成 DSK 的 初始 化 后 ，puts 语句 打印 出 单词 start 作为 指示 , 然后 进入 无 限 while 循环 中 。 每 
次 中 断 响 应 后 ， 进 入 ISR， 新 采集 到 的 一 个 数据 就 被 保存 到 大 小 为 64 的 数据 缓冲 区 中 。 

每 当 存储 一 个 新 抽样 数据 时 ， 缓 冲 区 索引 变量 就 会 增加 1。 当 到 达 缓冲 区 的 未 尾 时 ， 指示 缓冲 
区 满 , 这 时 打开 loop.dat 文件 ,缓冲 区 的 内 容 被 写 人 到 该 文件 中 ,然后 在 CCS 命令 窗口 显示 done 
作为 指示 。 不 断 重复 该 过 程 ， 然 后 采集 一 组 新 的 64 个 数据 ，done 指示 标志 会 再 一 次 显示 ( 当 每 
组 数据 存 满 缓冲 区 并 且 存 人 文件 loop.dat 后 ). 

建立 并 运行 工程 loop_print, 输入 频率 为 1 kHz 且 幅 度 为 1V ( 峰 - 峰 值 ) 的 正弦 信号， 当 指 示 
标志 done 显示 时 ， 停 止 程序 执行 。 缓 冲 区 中 表示 正弦 波 的 64 个 输入 数据 可 从 文件 loop.dat 恢复 
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HK. HA. 如 果 第 三 个 done 指示 标志 显示 后 ， 停 止 程序 执行 ， 第 三 组 64 个 数据 就 存 铺 到 缓冲 
区 并 打印 到 loop.dat 中 ,然后 可 以 使 用 面 图 程序 或 MATLAB. 画 出 loop.dat 的 图 形 ,检验 它 是 否 是 
1 kHz 的 波形 。 因 为 打印 语句 的 执行 较 慢 ， 因 此 不 能 恰当 地 实 蛙 侣 示 输 出 波形 。 





/iteep_print.¢g Data acquisition. Loop with data printed to a fila 


#include <stdio.h> 
$defne BUFFER_SIZE 64 
int i-0; 

int j=0; 

int buffer[BUFFER, SIZE]; 
FILE *fptr; 


interrupt void c intlli) 
UL. m 
int sample data; = ^ 


sample data = input sample); 
buffer[i] = sample data; 
i++; 
if (i ex BUFFER_SIZE - 1) 
{ 
fptr = fopeni*loop.dat",*w*); 
for (jz0; j«BUPFER SIZE; j++) 
fprintf(fptr,'&din', buffer[j}}; 
Eclose(fptr) ; 
1-0; 
puts ("done"); 
} 
output, gample(sample data); 
return; 


) 


void mainí) 

{ 
comm intrí); 
puts("startin*); 
while(1); 

} 


//buffer size 


. //bu£fer for data 


//file pointer 


//interrupt service routine 


//new input data 
/f/8tore data in buffer 
//increment buffer count 
//if buffer full 


//create output data fle 


//write buffer data to file 
//close file 

/finitialize buffer count 
//finished storing to file 


| //outfput. data - 


//return from ISR 


//init DSK, codec, McBSP 
//print "start" indicator 
//infinite loop 





图 4.13 输入/ 输出 数据 存储 到 绥 冲 区 ， 再 输出 到 文件 中 的 循环 程序 (loop printc ) 


例 2.7 使 用 查 表 法 产生 方 波 


本 例 使 用 查 表 法 产生 一 个 方 波 ， 并 且 介 绍 了 ADS35 的 数据 格式 。 图 2.14 给 出 了 实现 该 工程 
的 程序 squarewave.c。 建 立 大 小 为 256 的 整 型 数据 缓冲 区 ， 在 main 函数 中 ,在 缓冲 区 查找 表 中 存 
入 数据 : 前 半 部 分 存 人 (25- 1) 232 767, 后 半 部 分 存 人 -2 = -32 768。 当 每 个 抽样 周期 工 响应 中 
断 时 ， 将 缓冲 区 中 的 一 个 数据 送 到 输出 端 ;， 当 表 中 的 一 个 数据 送 到 输出 端 后 ， 程 序 执行 返回 到 无 
BR while 循环 ， 等 待 下 一 次 中 断 产 生 并 输出 表 中 的 下 一 个 数据 ; 当 到 达 缓冲 区 GR) 的 末尾 时 ， 
缓冲 区 的 索引 变量 会 被 重新 初始 化 并 指向 缓冲 区 的 开始 。 
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//Squarewave.c Generates a squarewave using a look-up table 


#define table size (int}0x100 
int data, tabie[table, size]; 
int i: 


interrupt void c intll() 

{ 

output sample(data table[il]; 
if (i < table size) ++i; 
else i = 0; 

return; 

} 


main ()} 
{ 


for(iz0; i«table size/2; i++) 


//size of table = 256 
//data table array 


//interrupt service routine 
//output value each Ts 
//fif table size is reached 


//reinitialize counter 
/freturn from interrupt 


//set lst half of buffer 





data table[i] = Ox7FFF; //with max value (2^15)-1 
for(i-table size/2; i«table, size; //set 2nd half of buffer 
data table[i] = -0x8000; //with -(2^15) 
i = 0; //reinit counter 
comm intr(): /finit DSK, codec, McBSP 
while (1); //infinite loop 


H 
图 2.14 产生 方 波 的 程序 ( squarewave.c ) 


建立 并 运行 工程 squarewave， 检 验 输 出 是 峰 - 峰 值 为 2.8 V、 WBA 1.1 V 的 方 波 信号。 

注意 , 因为 编 解 码 器 是 16 位 的 , 其 有 效 输 入 数据 在 -25 和 215_ 1 ZE, 即 -32 768 和 32 767。 
将 表 中 前 半 部 分 的 值 用 Ox8000 = 32 768 替换 0x7FFF = 32 767, 重新 建立 并 运行 工程 ,检验 一 下 ， 
这 时 将 不 会 再 产生 方 波 信号。 


例 2.8 使 用 查 表 法 产生 锯齿 波 

图 2.15 给 出 了 使 用 查 表 法 产生 锯 具 波 的 程序 famptablee， 建 立 大 小 为 1024 的 整 型 数据 缓冲 
区 , 在 main 函数 中 , 将 后 面 1024 个 数据 存 人 缓冲 区 查找 表 中 : 0, 0x20, 0x40, --., 也 就 是 0, 32, 64, 
5,32 736 (十进制 )。 

建立 并 运行 工程 ramptable, METH A — BA HATHA LI V, 
随 着 输入 32, 64, … 等 数据 而 减 小 ， 这 是 因为 AD535 编 解 码 回 的 数据 格式 是 二 进 制 补 码 ， 因 此 产 
EAR ARSE, ERMMBA TIER 14V, 

用 -0x20 代替 0x20， 检 验 这 时 产生 的 锯 货 波 是 正 斜 率 的 ， 峰 .峰值 为 14 V. SAARE 
KA 1.4 VY 开始 ， 增 加 到 约 2.5 v. 

例 2.9 不 用 查 表 法 产生 锯齿 波 

例 2.8 通过 在 查找 表 中 存 人 一 组 数据 ， 然后 在 每 个 抽样 周期 输出 查找 表 中 一 个 数据 ， 当 到 达 
查找 表 的 末尾 时 再 返回 查找 表 开 始 的 数据 。 2.16 给 出 了 与 例 2.8 使 用 不 同方 法 产生 锯齿 波 的 程 
FF ramp.c， 开 始 时 初始 输出 值 为 0， 输出 数据 值 按 每 个 抽样 周期 TWD 0x20， 这样 输出 的 数据 值 
就 是 0, 32, 64, 96, ---, 32 736, 
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//Ramptable.c Generates a ramp using a look-up table 


#define table size (int)0x400 //size of table=1024 


int data, table[table, size]; //data table array 
int i; 
interrupt void c intil() f/f/interrupt service routine 
1 
output sample(data table[i]); //ramp value for each Ts 
if (i < table size-1) i++; //if table size is reached 
else i = 0; //reinitialize counter 
return; //return from interrupt 
} 
main(í) 
1 
for(i=0; i < table size; i++} 
i 
data table[i] = 6x0; i //clear each buffer location 
data_tableJi] = i * 0x20; //set to 0,32,64,96, ... ,32736 
H 
i = 0; //reinit counter 
comm intrí); //init DSK, codec, McBSP 
while (1); /finfinite loop 


) 
SESE 


215 WHARA At ERIT ( camptable.c ) 
//Ramp.c Generates a ramp 


int output; 


interrupt void c intli() //interrupt service routine 


1 
output sample(output); /foutput for each sample period 
output += 0x20; ffincr output value 
if (output == 0x8000) //if peak is reached 
output - 0; //reinitialize 
return; //return from interrupt 


void main(í) 


{ 
output = 0; //init output to zero 
comm intrí); //init DSK, codec, McBSP 
whileíl); //infinite loop 


} 
eee 
. 图 216 锯齿 波 产生 程序 (rampe) 
建立 并 运行 工程 ramp， 检 验 输 出 结果 是 否 和 例 2.8 一 样 ， 产生 一 个 负 斜 率 的 锯齿 波 。 
为 了 得 到 一 个 正 斜 率 的 锡 齿 波 ， 将 输出 改 为 ; 
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output -= Ux20 


这 样 输 出 变 为 0, -32, 764, …, -32 736。 同 样 改变 重新 初始 化 output 的 让 语句 ， 即 ， 


if(output == -0x8000) 
Fea fs tH Fk pt TE A ER BTE 
912.10 回声 


图 2.17 给 出 了 产生 输入 信和 号 回声 的 程序 echo.c， 组 冲 区 长 度 或 大 小 决定 回声 的 效果 ，2000 
个 数据 点 的 缓冲 区 只 能 产生 清晰 的 匡 声 , 而 16 000 点 数据 的 缓冲 区 将 产生 太 长 的 延迟 , 它 产生 的 
效果 更 像 是 重复 。 输出 由 刚刚 得 到 的 抽样 值 和 最 早 存储 在 缓冲 区 中 的 抽样 值 的 和 组 成 。 如 果 绥 促 
区 太 小 ， 最 新 抽样 值 和 最 早 抽样 值 的 时 间 延 迟 太 短 就 听 不 到 回声 产生 的 效果 ， 将 最 早 抽样 值 做 一 
定 的 衰减 可 增强 回声 的 效果 。 


//Echo.c Echo effect changed with size of buffer (delay) 


short input, output; 
short bufferlength - 3000; //buffer size for delay 
short buffer[3000]; //create buffer 


short i = 0; 


short amplitude = 5; 


interrupt void c, intll() 

1 

input = input sample(!; 

output-input + 0.1*amplitude*buffer[i}; 
output, sample (output); 


buffer[i] - 
i++; 
if {i >= bufferlength) i = 0; 


input; 


//to vary amplitude of echo 
//ISR 


//newest input sample data 
//newest sample+oldest sample 
¿output sample 


//store newest input sample 
//increment buffer count 
//if end of buffer reinit 





} 


main() 

i 

comm intrí(); //init DSK, codec, McBSP 
while(1):; //infinite loop 


) 





FA 2.17 产生 回声 Cecho.c) 


当 采 集 到 新 的 抽样 值 时 ， 将 它 存 情 在 * 存储 单元 ， 这 时 输出 就 变 成 新 抽样 值 和 最 早 存储 在 存 
PET x + 1 的 抽样 值 的 和 ， 这 里 x = 0，1，2，.…，2998。 当 缓冲 区 索引 到 缓冲 区 的 末尾 时 
( buffer[2999} )， 新 得 到 的 抽样 存储 在 这 里 ， 最 早 的 抽样 值 在 缓冲 区 的 开始 。 | 

建立 并 运行 工程 echo， 波 形 文 件 theforce.wav (包含 在 辅助 材料 中 ) 可 以 用 做 输入 ， 可 用 共 
享 软件 Goldwave ( 在 附录 FE 中 有 介绍 ) 连续 不 断 地 循环 播放 该 文件 。 l 

把 缓冲 区 的 大 小 从 1000 个 数据 改 为 8000 个 数据 , 可 以 观察 到 较 大 的 缓冲 区 会 使 最 新 的 数据 和 
最 早 的 数据 产生 较 大 的 延迟 。 一 个 GEL 文件 ( 在 辅助 材料 中 ) 可 用 来 增加 或 三 小 幅度 或 回声 的 效果 。 

如 果 将 输出 〈 代 蔡 输入 ) 存储 在 缓冲 区 中 ， 回 声效 果 会 逐渐 消失 。 使 用 : 
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buffer[i] = output 
BREUER, MUGIDSGNOR REG AAR. 


例 2.1 使 用 两 个 中 断 ， 产 生 不 同 效果 的 回声 

本 例 扩展 了 例 2.10, 增加 了 一 些 附 加 的 回声 效果 。 它 采用 另 一 种 方法 , 用 两 个 中 斯 进行 读 写 。 
使 用 三 个 滑动 条 控制 最 早 输 人 抽样 值 的 幅度 ， 改 变 缓冲 区 的 大 小 产生 不 同 的 延迟 效果 以 及 回声 逐 
渐 消 失 的 效果 . 图 2.18 给 出 了 实现 该 工程 的 程序 echo_contrelLc。 和 前 面 的 例子 一 样 , 它 使 用 发 送 
中 断 INT11 写 人 数据 ， 另 外 ， 它 还 使 用 接收 中 断 INT12 读 人 数据 。 除了 下 面 一 些 改动 外 ,支持 文 
件 也 和 前 面 的 例子 相同 。 


1. 修改 文件 c6xdskinit.c， 以 控制 两 个 中 断 。 在 文件 c6xdskinit.c 中 添加 下 面 商行 程序 代码 ， 


config_Interrupt_Selector(12,RINTO); //receive INT12 
enableSpecificInt (12); //interrupt 12 


2， 修 改 矢量 文件 vectors_11.asm， 添 加 和 INTI2 有 关 的 指向 中 断 服务 程序 c int 2 的 分 支 指 
令 ， 文件 vectors, 11. 12.asm 中 也 进行 这 种 修改 。 


//Echo control.c Echo using two interrupts for read and write 
//3 sliders to control effects: buffer size, amplitude, fading 


‘short input, output; 


short bufferlength = 1000; /finitial buffer size 

short i = 0; //buffer index 

short buffer [8000]; //max size of buffer 

short delay = 1; //determines size of buffer 
short delay flag = 1; //flag if buffer size changes 
short amplitude - 1; /f/amplitude control by slider 
short echo type - 0; //no fading (1 for fading) 
interrupt void c, intl11() //ISR INT11 to write 

{ 

short new_count; //count for new buffer 


output=input+0.1*amplitude*buffer [i]; //newest+oldest sample 


if (echo type == 1) //if fading is desired 
{ 
new count = (i-1) % bufferlength; //previous buffer location 
buffer[new count] = output; //to store most recent output 
} 

output sample(output); //output delayed sample 

} 

interrupt void c_intl2() i //ISR INT12 to read 

{ . 

input = input_sample(); - //newest input sample data 
if (delay flag != delay) //if delay has changed 


t //->new buffer size 
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delay_flag = delay; 


bufferlength = 1000*delay; 


i = Ù; 

} 
buffer[i] = input; 
i++; 


if (i == bufferlength) i=0; 


} 


main {} 

{ 

comm intrí): 
while{1); 

} 


//reint for future change 
//new buffer length 
//reinit buffer count 


//store input sample 
//increment buffer index 
//if @ end of buffer reinit 


//init DSK, codec, McBSP 
/finfinite loop 





图 2.18 具有 不 同 控制 效果 的 回声 产生 程序 (echo control.c ) 


和 例 2.10 一 样 ， 使 用 相同 的 文件 theforce.wav 作为 输入 在 辅助 材料 中 }。 在 每 个 抽样 周期 产 
生 一 次 中 断 : 首先 INTI1 写 人 数据 ， 然 后 INT12 读 出 数据 ， 输 出 是 最 新 输入 抽样 和 最 早 抽 样 的 和 。 


， 建 立 并 运行 工程 echo. control, 


2. 访问 三 个 滑动 条 :; TA, 延迟 和 类 型 ,图 2.19 给 出 了 GEL 文件 echo_control.gel。 将 振幅 
设置 滑动 条 设置 在 位 置 5， 延 迟 滑动 条 设置 在 位 置 3， 因 为 延迟 不 等 于 delay_flag， 所 以 
缓冲 区 的 大 小 已 经 改变 了 , 新 的 缓冲 区 大 小 设置 为 1000 x 3 = 3000, 这 两 个 滑动 条 的 设置 
对 应 于 例 2.10 中 的 相 则 条件。 延迟 滑动 条 可 取 值 1,2, …,8， 这 样 允许 将 缓冲 区 的 大 小 设 
EA 1000, 2000, 3000, …, 8000。 提 高 延迟 滑动 条 的 值 到 4 和 5， 延 长 最 新 数据 和 最 早 数 


据 之 问 的 延迟 ， 观 察 回声 效果 。 


3. 类 型 滑动 条 在 位 置 1 时 ， 将 产生 回声 逐渐 消失 的 效果 ， 因 为 输出 变 成 最 近 的 输出 。 为 了 
获得 清晰 的 回声 逐渐 消失 的 效果 ， 暂 时 停止 播放 输 人 的 theforce. wav 文件 。 


用 三 个 滑动 条 进行 实验 ,会 产生 不 同 的 回声 效果 。 


//Echo control.gel Sliders vary time delay, amplitude, and type of echo 


menuitem "Echo Control” 


slider Amplitude(1,8,1,.1,amplitude parameter) /*incr by 1, up to B*/ 


{ 


amplitude = amplitude_parameter; 


} 


slider Delay(1,8,1,1,delay parameter) 


{ 
delay = delay parameter; 
) 


slider Type(0,1,1,1,echo typeparameter) 


{ 


echo, type = echo_typeparameter; 


} 


/*vary amplit of echo*/ 
/*incr by 1, up to 8*/ 
f*vary delay of echo*/ 
/*incr by 1, up to i*/ 


/*echo type for fading*/ 


os SSS 
图 2.19 ERMER, EIR AEA GEL 文件 ( echo_control.get ) 





42 DSP 原理 及 其 CC 编程 开发 技术 


例 2.12 用 程序 中 产生 的 数据 表 产 生 正弦 波 

本 例 产生 正弦 信号 一 个 周期 的 数据 ， 这 些 数据 用 来 建立 一 张 查 找 表 ， 然 后 输出 这 些 数据 ， 产 
EERE. 图 2.20 给 出 了 实现 该 工程 的 程序 sinegen_table.c, 它 产生 频率 f= 天 点数 = 8000/10 = 
800 Hz MIE (AS. | 

建立 并 运行 sinegen table 工程 ， 在 该 工程 中 使 用 了 发 送 中 类 INT11， 检 验 产生 的 正弦 波 频率 是 
否 为 800 Hz。 疏 变数 据点 数 ， 产 生 一 个 400 Hz HERH (RERE table, size )。 


//Sinegen table.c Generates a sinusoid for a look-up table 


#inciude <math.h> 
#define table size (short}10 //set table size 


short sine _table[table_ size]; //sine table array 

short i; 

interrupt void c intll() //interrupt service routine 

{ l 

output sample(sine table[i]); //cutput each sine valve- 

if (i < table size - 1) ++i; //incr index until end of table 
eise i - 0; //reinit index if end of table 

return;. //return from interrupt 


) 


void main() 
1 
‘float pi-3.14159; 


for(i = 0; i « table size; i++) 
. Bine téble[il-10000*sin(2.0*pi*i/table size); //scaled values 


i = 0; 
comm intr(); //init DSK, codec, McBSP 
while(l)r //infinite loop 


eee 
图 2.20 ERFARE, HM EERROR ( sinegen_tabie.c ) 


$42.13 EA MATLAB 建立 的 查找 表 产 生 正 弦 波 

本 例 介绍 了 使 用 MATLAB 产生 查 表 法 ， 进而 产生 正 艾 波 的 过 程 。 图 2.21 给 出 了 MATLAB 
程序 sin1500.m, 它 产生 了 包 售 24 个 周期 128 个 数据 点 的 文件 ， 生成 的 正弦 波 频率 是 F = F, x 周 
期 数 / 总 点 数 = 1500 Hz. 

ft MATLAB 中 运行 sin1500.m， 检 验 包 含 128 个 数据 点 的 头 文件 sin1500.h 是 否 和 图 2.22 所 
示 一 致 。 用 不 同 的 点 数 表示 不 同 的 正弦 信号 频率 , 这 一 点 只 需 在 MATLAB 程序 sin1500.m PUR 
小 改动 就 可 很 方 使 地 实现 。 

图 2.23 给 出 了 实时 实现 该 工程 的 C 程序 sin1500MATL.c， 它 包含 MATLAB "mS 
也 可 参见 例 2.12， 它 在 C 源 程序 main 中 产生 数据 表 ， 而 不 是 在 MATLAB 中 产生 数据 表 。 

建立 并 运行 工程 sin1500MATL, 检验 输出 是 否 是 1500 Hz IER EAS 号 。 注意 当 在 CCS 中 查 
看 关 文 件 sn1500 了 时 ， 罗 仔细 一 些 ， 避 免 把 头 文件 截断 。 
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Wzinl500.m Generates 128 points representing sin(1500) Hz 
Creates file sinl500.h 


for i=1:128 

sine(i} = round (1000*sin (2*pi* (i-1)*1500/8000)); %sin(1500} 
end 
fid = fopení('sinl500.h','w'); topen/ create file 
fprintf {fid, ‘short sin1500[128]-('); Sprint array name, "={* 
fprintf(fid,'$d, ' ,sine(1:127)); Sprint 127 points 
fprintf(fd,'&d' ,sine(128)); Sprint 128th point 
fprintf (fid,’};\n‘); *print closing bracket 
fclose(fd); fclose file 


$n sese Me 
图 2.21 Hi MATLAB 产生 正弦 波 查找 表 的 程序 ( 9in 500m) 


short sini500[128]-(0, 924, 707, -383, -1000, -383, 707, 924, 0, 
-924, -707, 383, 1000, 383, -707, -924, 0, 924, 707, -383, 
-1000, -383, 707, 924, 0, -924, -707, 383, 1000, 383, -707, 
-924, 0, 924, 707, -383, -1000, -383, 707, 924, 0, -924, -707, 
383, 1000, 383, -707, -924, 0, 924, 707, -383, -1000, -383, 707, 
924, 0, -924, -707, 383, 1000, 383, -707, -924, 0, 924, 707, 
-383, -1000, -383, 707, 924, 0, -924, -707, 383, 1000, 383, 
-707, -924, 0, 924, 707, -383, -1000, -383, 707, 924, 0, -924, 
-707, 383, 1000, 383, -707, -924, 0, 924, 707, -383, -i000, 
-383, 707, 924, 0, -924, -707, 383, 1000, 383, -707, -924, 0, 
924, 707, -383, -1000, -383, 707, 924, 0, -924, -707, 383, 1000, 
383, -707, -924); 

eee 

图 222 MATLAB 产生 的 正 蓄 波 杏 找 表 头 文件 ( sin1500.h 1 


//8inl500MATL.c Generates sine from table created with MATLAB 


#include "sini500.h* /f/sin(1500} created with MATLAB 
short i=0; 


, interrupt void c_int11{) 
i 
output sample(sinl1500[i]);  //output each sine value 


if (i < 127) ++i: ffiner index until end of table 
else i - 0; 

return; //return from interrupt 

} 
void main() 

{ 

comm intrí); //init DSK, codec, McBSP 
whileí1); //infinite loop 

} 


eee 
图 2.23 产生 正弦 波 的 程序 ， 该 程序 利用 MATLAB 产生 的 数据 作为 头 文件 (sinl500MATLe ) 
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例 2.14 幅度 调制 


本 例 介绍 本 幅度 调制 (AM) 的 实现 方案 , 图 2.24 给 出 了 产生 AM 信号 的 程序 AM.c,, Hab 
区 baseband 含有 20 个 数据 点 ; 表示 频率 = FJ20 = 400 Hz MARRIES; 缓冲 区 carrier 也 
有 20 个 数据 点 ,表示 频率 f= Fx 局 期 数 /总 点 数 = 已 /每 周期 的 点 数 = 2 kHz 的 载波 信号 ; 变 
量 amp 用 来 改变 调制 信号 的 幅度 。AM.c 源 程序 不 是 中 源 驱 动 的 , 需要 选择 合适 的 矢量 支持 文件 。 

建立 和 实现 工程 AM， 检 验 输 出 信号 中 包含 2 kHz 的 载波 信号 和 两 个 边 带 信号 。 边 带 信 号 的 
频率 等 于 载波 信和 号 加 或 减 边 带 信号 的 频率 ， 也 就 是 1600 Hz 和 2400 Hz 信号 。 


{/fAM.c AM using table for carrier and baseband signals 
short amp = 1; 


void main(} 

{ . . 

short baseband[20]-(1000,951,809,587,309,0,-309,-587,-809, -951, 
-1000,-951,-809,-587,-309,0,309,587,809,951); //400-Hz baseband 

short carrier[20] -2(1000,0,-1000,0,1000,0,-1000,0,1000,0, 
-1000,0,1000,0,-1000,0,1000,0,-1000,0); //2-XBz carrier 

short output[20]; l 


short k; 
comm polli); /finit DSK, codec, McBSP 
while(1) //infinite loop 


{ 
for (k=0; k«20; k++) 

{ 
output [Kk]= carrier{k] + ((amp*baseband{k] *carrier[k]/10)>>12); 
output_sample(20*output [k}}; //scale output 
} 

} 

} 


eee 


图 2.24 幅度 调制 程序 (AM.c ) 


加 载 GEL 文件 AM.gel， 增 大 变量 amp 的 值 ， 检 验 被 调制 的 基带 信和 号。 注意 载 波 和 基带 信号 
的 积 (在 输出 等 式 内 ) 被 除 以 22 ( 右 移 12 位 ) SE EHRRUM ( 见 例 49) 进一步 利用 调制 以 达到 
扰乱 输入 信和 的 目的 。 


使 用 外 部 输入 作为 边 带 信号 的 调幅 方法 

程序 AM_extin.c ( 在 辅助 材料 中 ) 介绍 了 另外 一 种 获得 AM 信和 号 的 方法 ， 它 利用 外 部 输入 信 
号 作为 边 带 信号， 用 查 表 方法 产生 2 kHz 的 载波 信和 号 。 

建立 工程 AM_extin, 使 用 幅度 小 于 0.35 V、 频 率 低 于 2 kHz 的 信号 作为 正弦 边 带 信 号, 检验 


该 工程 的 输出 信和 号 ， 这 样 小 的 外 部 答 入 信号 产生 了 更 加 稳定 的 输出 。 注意 当 输 入 边 带 信 号 频率 超 
M 2kHzBf, MATERA. 
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例 2.15 使 用 8000 点 的 查找 甫 产生 扫 频 的 正弦 波 


图 2.25 给 出 了 使 用 8000 点 的 查找 表 产 生 扫 频 正 蓄 信 号 的 程序 sweep8000.c, 头 文件 sine8000_ 
table.h 含有 8000 个 数据 点 ， 表 示 一 个 周期 正 汞 波 。 因 为 输出 点 速率 已 = 8 kHz， 输 出 8000 个 数 
据点 正好 是 1s 的 时 间 ,( 辅助 材料 中 的 ) 头 文件 利用 了 MATLAB 中 的 编程 语句 ， 


1000*sin(2*pi*i*start,freq/8000) 
产生 ， 图 2.26 给 出 了 头 文件 sine8000_table.h 的 一 部 分 。 


//sweepB000.c Sweep sinusoid using table with 8000 points 


#include *sine8000_table.h* //one cycle with 8000 points 
short start freq - 100; //initial frequency 

short stop freq - 3500; //maximum frequency 

short step freq = 200; //increment/step frequency 
short amp - 30; //amplitude 

short delay msecs - 1000; //€ of msec at each frequency 
short freq; 

short t; 

short i = Ü; 


void main(} 
{ 
comm_poll(}; //init DSK, codec, McBSP 
while(i) /finfinite loop 
t 
for (freq=start_freq; freq<=stop_freq; freq+=step_freq) 


{ //step thru fregs 
for{t=0; t«B*delay msecs; t++} //output B*delay msecs samples 
1 // at each freq 
output sampleí(amp*sine8000[i]!; //output 
i = {i + freq) & 8000; //next sample is + freq in table 


} 
} 
} 
} 
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设 定 初始 频率 为 100 Hz， 步 进 为 200 Hz， 最 高 频率 为 3500 Hz， 产 生 的 信号 频率 有 100 Hz, 
300 Hz, 500 Hz, …, 3500 Hz， 每 一 个 频率 信号 持续 时 间 都 为 1 s。 

将 delay_msecs 从 1000 增加 到 2000, 从 而 产生 一 个 较 慢 的 扫 频 速率 , 这 样 每 个 频率 信号 持续 
时 间 为 2 s。 如 果 step freq 增加 到 700， 产 生 的 信号 频率 就 是 100 Hz, 800 Hz, 1500 Hz, 2200 Hz 和 
2900 Hz。 
索引 变量 以 freq 递增 ， 它 决定 从 表 中 选取 的 数据 点 ( 参见 例 2.4 )， 例 如 为 了 产生 100 Hz 频 
率 的 信号 ， 表 中 每 隔 100 个 点 选择 一 个 点 ， 输 出 80 个 数据 点 相当 于 一 个 周期 ，8000 点 对 应 100 
个 周期 。 使 用 这 种 方案 ，8000 点 总 是 用 于 以 每 秒 x 周 期 的 速率 生成 各 个 频率 的 信号 。 
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建立 并 运行 工程 sweep8000, 检验 输出 是 否 为 正弦 扫 频 信号, 注意 源 程序 sweep8000.c 不 是 中 
断 驱 动 的 〈 用 合适 的 矢量 文件 )， 可 用 滑动 条 来 控制 变量 amp， 进 而 控制 频率 信号 的 幅度 ， 用 
delay_msecs ( HEE) 变量 控制 每 个 频率 的 持续 时 间 ， 用 step, freq 控制 频率 的 步 进 。 


//wineB000 table.h Sine table with 8000 points generated with MATLAB 


short sine8000[8000]z 
(0, 1, 2, 2, 3, 4, 5, 5, 
6, 7, 8, 9, 9, i10, 11, 12, 


94, 95, 96, 96, 97, 98, 99, 100, 
100, 101, 102, 103, 103, 104, 105, 106, 
107, 107, 108, 109, 1i0, 111, 111, 112, 


-13, -i2, -11, ~10, -3, -9, -8, -", 
-6, -5, -5, -4, -3, -2, -2, -i) 





图 2.26 8000 点 的 正弦 信号 部 分 数据 (sineS000 table.h ) 


$462.16 FEE ARLE PEI 


图 2.27 h T PIE OR LR HETUBSTRH noise_gen.c， 伪 随机 序列 是 基于 最 大 长 度 序列 
技术 的 算法 ， 采 用 软件 方法 产生 。 先 给 寄存 器 赋 一 个 16 位 的 初始 种 子 值 ， 位 BO, bl, bli 和 
b13 相 异 或 ， 并 将 异 或 的 结果 放 人 反馈 变量 中 。 放 有 初始 种 子 的 移 位 寄存 器 再 左 移 一 位 ， 反馈 
变量 再 被 研 给 移 位 寄存 器 的 b0 位 。 概 据 寄存 器 DO 位 是 0 还 是 1， 给 prnseq 赋 一 个 定 标的 最 小 
值 或 最 大 值 ， 该 值 对 应 于 噪声 信号 的 幅度 。 辅助 材料 中 的 头 文件 noise_gen.h 定义 了 寄存 器 的 
各 比特 位 。 

建立 并 运行 工程 noise_gen, 可 以 看 到 时 域内 的 噪声 或 听 到 噪声 信和 号 , 将 噪声 电 平 按 -- 定 比例 
增加 到 +16 000, 检查 产生 的 噪声 信号 电 平 是 否 变 大 了 。 将 信号 输出 连接 到 频谱 分 析 仪 上 , 检查 输 
S TEARRE 3500 Hz MPRA EHF, 3500 Hz JEARÁRESMIAR LIURE 
器 的 带宽 。 
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//Noise gen.c Pseudo-random sequence generation 


Kinclude "noise gen.h" 
int fh; 
shift reg sreg; 


interrupt void c inti1í) 
{ 
int prnseq; 


if(sreg.bt.b0) 
prnseq - 
else 
prnseq - 8000; 
fb -(sreg.bt.b0)^isreg.bt.b1); 
fb *=(sreg.bt.bli)*{sreg.bt.b13); 
Sreg.regval««-1; 
sreg.bt.b0 = fb; 


-8000; 


cutput sampleíprnseq); 
return; 
} 


void main() 

{ 

sreg.regval = 
fb = 1; 
comm_intr(); 
while (1); 

} 


ÜxFFFF; 


//header fle for noise sequence 
//shift reg structure 
//interrupt service routine 
/ffor pseudo-random sequence 


//sequence[1,-1)based on bit bo 
//scaled negative noise level 


//scaled positive noise level 
//XOR bits 0,1 

/fwith bits 11,13 -»£fb 

//shift register 1 bit to left 
//close feedback path 


//output scaled sequence 
//xeturn from interrupt 


//set shift register 
f/finitial feedback value 
/finit DSK, codec, McBSP 
/finfinite loop 





2.27 伪 随 机 曲 声 序列 产生 程序 ( noise_gen.c ) 
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本 章 主要 介绍 TMS320C6x 处 理 器 的 硬件 结构 和 指令 系统 、 寻 址 方式 、 汇 编 器 指令 、 线 性 汇 
编 器 以 及 使 用 CC 语言、 汇编 和 线性 汇编 指令 编写 的 程序 实例 。 


31 引言 


1982 年 ,TI 公司 推出 了 第 一 代 TMS32010 数字 信号 处 理 器 ,1986 年 又 接着 推出 了 TMS320C25 
数字 信号 处 理 器 中 ，1991 年 推出 了 TMS320C50 数字 信号 处 理 器 。C1x，C2x 和 C5x 不 同系 列 不 
同型 号 的 处 理 器 具有 不 同 的 特点 ， 例 如 在 处 理 速度 方面 就 有 很 大 的 不 同 ， 但 这 些 16 位 的 处 理 器 
都 是 定点 处 理 器 且 指令 是 兼容 的 。 

在 汉 - 诺 依 盟 总 线 结构 处 理 器 中 ， 程 序 指令 和 数据 存储 在 周一 个 存 情 器 空间 里 。 采 用 冯 : 诺 
依 曼 总 线 结构 的 处 理 器 , 一 个 指令 阁 期 内 只 能 进行 一 次 读 或 写 存储 器 操作 , 而 典型 的 DSP 应 用 需 
要 在 一 个 指令 局 期 内 访问 存储 器 数 次 。 定 点 处 理 器 CIx，C2x 和 C5x 基于 改进 的 哈佛 总 线 结构 ， 
程序 指令 和 数据 具有 独立 存储 空间 ， 因 此 允许 同时 访问 数据 和 程序 指令 。 

ADC 的 量化 误差 和 舍 人 舍 出 噪声 是 定点 处 理 器 所 面临 的 问题 。ADC 利用 一 个 最 佳 的 估计 数值 
代替 输入 信和 叶 样 值 ， 例 如 ， 假 设 考虑 一 个 ADC 的 字 长 为 8 位 , 输入 信号 范围 是 -1.5 V 到 +1.5V， 则 
ADC 的 基 化 步 长 是 ,输入 范围 /28= 3/256 = 1172mvV, 因 此 莉 化 过 程 产 生 的 误差 可 能 达到 +I1.72 mV/2 
= 15.86 mV。 当 输 人 电压 不 是 11.72 mV 的 整数 倍 时 ，APC 用 一 个 最 佳 值 来 表示 输入 信号 样 值 。 
对 于 8 位 的 ADC 来 说 , 可 用 2: 或 256 个 不 同 的 电 平 来 表示 输入 信号。 对 于 字 长 更 长 的 ADC, Bl 
如 16 位 的 ADC (这 种 器 件 现在 比较 常见 ), 它 能 够 碱 小 量化 误差 .从 而 具有 更 高 的 分 辩 率 。APDC 
的 字 长 位 数 越 多 ， 就 能 更 精确 地 表示 输入 信和 号 的 大 小 。 

TMS320C30 是 20 世纪 80 年 代 后 期 推出 的 浮 点 处 理 器 ，C31，C32 和 最 近 的 C33 都 属于 C3x 
APN SAE RA), Bü C4x 系列 浮 点 处 理 器 与 C3x 系列 在 指令 上 是 兼容 的 ， 它 
们 都 基于 改进 的 哈佛 总 线 结构 中 

1997 年 推出 的 TMS320C6201 ( C62x ) 是 C6x 系列 定点 数字 信和 号 处 理 器 的 第 -一 个 成 员 ， 和 以 
前 的 定点 处 理 器 Cix, C2x 和 C5x 有 所 不 同 ，C62x 采用 了 超 长 指令 字体 系 结构 (VLIW), BF 
指令 和 数据 仍然 使 用 和 哈佛 总 线 结构 一 致 的 独立 存储 空间 。VLIW 结构 具有 简单 的 指令 ， 但 和 传 
统 结构 的 DSP 相 比 ， 对 于 一 个 基体 的 应 用 来 说 ，VLTW 处 理 器 需要 更 多 的 指令 。 

C62x 和 前 几 代 的 定点 处 理 器 指令 是 不 兼容 的 ， 后 来 推出 的 TMS320C6701 ( C67x ) 浮 点 处 理 
BRE C6x 系列 处 理 器 的 又 一 个 成 员 .C62x 系列 定点 处 理 器 的 指令 集 是 C67x 处 理 器 指令 集 的 子 集 ， 
附录 A 列 出 了 C6x 处 理 器 的 指令 ，C64x 是 最 近 推 出 Cox 系列 的 一 个 定点 处 理 器 。 

一 个 专用 集成 电路 艺 片 (ASIC) 内 含有 一 个 DSP 内 核 和 特定 应 用 相关 的 用 户 电路 ，C6x 处 
理 器 可 以 作为 标准 通用 的 DSP， 通 过 编程 实现 特定 的 应 用 。 在 调制 解 调 器 、 回 声 抵 销 加 及 其 他 产 
品 中 都 含有 专用 数字 信号 处 理 髓 。 

定点 处 理 器 更 适 于 使 用 电池 的 设备 中 ， 璧 如 蜂 窒 电话 。 因 为 与 一 个 同等 的 浮 点 处 理 器 相 比 ， 
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它 具 有 较 小 的 功 耗 ，Clx，C2x 和 C5x 是 16 位 的 定点 处 理 器 ， 具 有 有 限 的 动态 范围 和 精度 ， 而 
Cox 定点 处 理 器 是 32 位 的 处 理 器 , 具有 较 好 的 动态 范围 和 精度 。 对 于 定点 处 理 器 , 需要 对 数据 进 
et. 溢出 也 是 一 个 需要 注意 的 问题 ， 这 种 情况 发 生 在 进行 运算 时 ， 例 如 两 个 数 相 加 ， 计 算 结 
果 比 处 理 器 寄存 器 的 位 数 更 多 ， 这 时 就 会 发 生 溢 出 现象 。 

浮 点 处 理 器 的 价格 一 般 来 说 相对 较 高 ， 因 为 处 理 器 芯片 有 一 些 额 外 的 电路 ， 以 进行 整数 和 浮 
点 算术 处 理 ， 因 而 芯片 具有 更 多 的 资源 或 体积 相对 更 大 一 些 。 当 选择 专用 数字 信和 号 处 理 器 时 ， 价 
格 、 功 耗 和 运算 速度 是 几 个 重要 的 考虑 因素 。C6x 系列 处 理 器 包括 定点 处 理 器 《如 C62x, C6dx ) 
种 浮 点 处 理 器 〈 如 C67x )， 特 别 适合 应 用 于 需要 较 强 计算 能 力 的 场合 。 当 然 也 可 以 选择 其 他 公司 
的 数字 信号 处 理 器 ， 如 Motorola, Analog Devices 等 公司 的 产品 中 。 | 

其 他 的 结构 ， 包 括 Super Scalar 结构 ， 需 要 专用 硬件 决定 哪些 指令 并 行 执 行 。 和 VLIW 结构 
处 理 器 不 一 样 ， 对 于 Super Scalar AALER, PARAM, TRA ARR 
大 。 它 不 一 定 执行 相同 的 一 组 指令 ， 因 此 难于 定时 ， 很 少 应 用 于 DSP 中 。 


32 TMS320C6x 的 结构 


DSK 板 上 的 TMS320C6711 是 基于 VLIW 结构 的 浮 点 处 理 器 &29, 内 部 存储 器 采用 两 级 高 速 组 
存 结构 , 包括 第 一 级 4 kB 的 高 速 程序 缓存 (LIP )、4 kB 高 速 数据 缓存 (LID ) 和 第 二 级 64 kB RAM 
或 者 数据 /程序 高 速 缓存 (L2). TMS320C6711 具有 同步 存储 器 ( SDRAM 和 SBSRAM ) 和 异步 存 
fiat (SRAM 和 EPROM) 的 直接 接口 。 虽 然 同 步 存储 器 需要 时 钟 信 号 ， 但 是 它 是 介 于 选择 静态 
SRAM 和 动态 SDRAM 的 比较 折 中 的 办 法 ， 因 为 SRAM 的 速度 虽然 比 DRAM 快 ， 但 是 价格 却 相 
对 较 高 。 

DSP 芯片 上 的 外 围 设备 包括 两 个 多 通道 串 行 口 (McBSP )、 两 个 定时 器 、 一 个 16 位 主机 端 并 
行 接口 (HPI) 和 一 个 32 位 扩展 存储 器 接口 (EMIF )。DSP 外 转 UO 接口 的 电源 电压 是 3.3 V, V 
内 核电 压 是 18 V。 内 部 总 线 包括 一 个 32 位 程序 地 址 总 线 和 一 个 256 位 程序 数据 总 线 。256 位 程 
序数 据 总 线 可 以 提供 存放 8 个 32 位 指令 或 可 分 别 作为 两 个 32 位 的 数据 地 址 总 线 、 两 个 64 位 的 
数据 总 线 和 两 个 64 位 的 数据 存储 总 线 。 通过 32 位 的 地 址 总 线 , DSP 导 址 空间 总 共 可 以 达到 2” = 
4GB, 包括 4 个 外 部 存储 器 空间 ; CE0，CE1，CE2 和 CE3。 图 3.1 是 包含 在 CCS 中 C6711 处 理 
器 的 功能 单元 框图 。 

C6x 蕊 片上 独立 的 存储 体 允 许 在 一 个 指令 周期 内 访问 存储 器 两 次 ， 两 个 独立 的 存储 体 可 以 通 
过 两 套 独立 的 总 线 进行 访问 。 因 为 内 部 存储 器 是 按照 存储 体 来 组 织 的 ， 所 以 可 以 并 行 执行 两 条 装 
载 或 者 两 条 存储 指 邻 。 上 只 要 同时 访问 不 间 的 存 情 体 ， 就 不 会 产生 数据 存 取 冲 罕 。 独 立 的 程序 、 数 
据 以 及 直接 存储 器 访问 CDMA ) 总 线 使 C6x 可 以 并 行 执行 指 今 读 取 、 数 据 读 写 以 及 DMA 操作 。 
因为 数据 和 指令 存放 在 不 局 的 存 情 空 间 ， 因 此 可 以 并 行 访问 存储 空间 ， 进 行 积 序 指令 的 读 取 和 数 
据 的 存 取 。C6x 还 有 可 按 字 节 寻 址 存储 空间 ， 内 部 存储 器 由 相互 独立 的 程序 存储 器 和 数据 存储 器 
组 成 ， 通 过 内 部 32 位 端口 ( C64x 为 两 个 64 位 端口 ) 访问 内 部 存储 空间 。 

DSK 上 的 C6711 包含 地 址 从 0x00000000 开始 的 72 kB 内 部 存储 器 以 及 16 MB 外 部 SDRAM, 
通过 CE0 映射 到 从 0x80000000 开始 的 地 址 空间 , 除 此 之 外 , DSK 板 上 还 有 128 kB 的 闪存 , 其 地 
址 从 0x90000000 开始 。 图 3.2 是 包含 在 CCS 中 的 两 级 内 部 存储 器 结构 框图 。 表 3.1 列 出 了 存储 器 
的 映射 地 址 空间 。 在 CCS 中 ,还 有 DSK 的 电路 原理 图 ， 文 件 名 为 C67 11dsk_schematics.pdf,. 
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X350 大 储 器 地 址 空间 分 配 情 况 


地 址 范围 CHex) 大 小 内 存 块 说 骨 

0000 0000 一 0000 FFFF 64 KB 内 部 RAM (L2) 

0001 0000—017F FFFF 24 MB-64 KB 保留 

0180 0000—0183 FFFF 256 KB 内 部 配置 总 线 EMIF 寄存 器 
0184 0000—0187 FFFF 256 KB 内 部 配置 总 线 L2 控制 寄存 器 
0188 0000—018B FFFF 256 KB 内 部 配置 总 线 HPI 寄存 器 
018C 0000—018F FFFF 256 KB 内 部 配置 总 线 McBSP 0 寄存 器 
0190 0000—0193 FFFF 256 KB 内 部 配置 总 线 McBSP 1 寄存 器 
0194 0000 一 0197 FFFF 256 KB 内 部 配置 总 线 定 时 器 0 寄存 器 
0198 0000—019B FFFF 256 KB 内 部 配置 总 线 定时 器 1 寄存 器 
019C 0000 一 019F FFFF 256 KB 内 部 配置 兽 线 中 断 选择 器 寄存 器 
01A0 0000—01A3 FFFF 256 KB 内 部 配置 总 线 EDMA RAM ARTH 
0LA4 0000--01FF FFFF 6 MB-256 KB 保留 C 

0200 0000—0200 0033 52 QDMA ATEA 

0200 0034—2FFF FFFF 736 MB-52 保留 

3000 0000—3FFF FFFF 256 MB McBSP 0/1 数据 

4000 0000—7FFF FFFF 1GB 保留 

8000 0000—8FFF FFFF 256 MB 外 部 内 存 接口 CE0 

9000 0000—9FFF FFFF 256 MB 外 部 内 存 接口 CE1 

A000 0000—AFFF FFFF 256 MB 外 部 内 存 接口 CE2 

B000 0000—BFFF FFFF 256 MB 外 部 内 存 接口 CE3 

C000 0000—FFFF FFFF 1GB 保留 





DSK 板 上 如 果 采 用 150 MHz 的 时 钟 ， 理 想 情 况 下 一 个 周期 内 可 以 实现 两 次 蔽 法 和 加 法 运算 ， 
每 秒 时 间 内 总 共 可 实现 3 亿 次 乘法 和 累加 操作 (MAC )。 图 3.1 画 出 了 Cox 的 8 个 功能 单元 ,使 
用 其 中 能 够 处 理 浮 点 操作 的 8 个 功能 单元 (不 包括 下 面 将 要 介绍 的 .D 功能 单元 )， 每 种 可 执行 9 
亿 次 浮 点 操作 。 也 就 是 说 ，DSP 工作 在 150 MHz 时 钟 时 ， 处 理 速 度 相 当 于 执行 每 秒 12 亿 条 指令 ， 
其 指令 周期 为 6.67 ns。 


3.3 功能 单元 


如 图 3.1 所 示 ，CPU 包括 8 个 独立 的 功能 单元 , 分 成 A AB 两 组 独立 的 数据 通道 。 每 个 通道 
含有 一 个 乘法 操作 单元 〔【.M ),， 一 个 逐 辑 和 算术 运算 单元 ( 工 )， 一 个 分 支 、 位 操作 和 算术 运算 音 
756 CS) 以 及 装 裁 /人 存储 和 算术 单元 (.D )， 其 中 .S ALL 单元 用 来 执行 算术 、 逐 辑 以 及 分 支 指令 ， 
所 有 数据 传输 都 使 用 .D 单元 。 

算术 运算 ， 如 加 法 或 减法 (SUB 或 ADD), 可 以 由 除 .M 单元 出 外 的 所 有 功能 单元 执行 (每 
个 数据 通道 有 一 个 ,M 单元 ), 8 个 功能 单元 包括 4 个 浮 点 /定点 ALU (MAL 单元 和 两 个 .S 单元 入 
黄 个 定点 ALU (.D 单元 ) 以 及 两 个 浮 点 /定点 染 法 器 CM 单元 )。 每 个 功能 单元 都 可 以 在 自己 的 
通道 内 直接 读 或 写 寄 存 器 组 中 的 寄存 器 , 每 个 通道 含有 16 个 32 位 的 寄 在 器, A 通道 含有 A0~A15 
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的 16 个 寄存 器 ，B 通道 含有 BO-Bi5 的 16 个 寄存 器 。 以 1 结尾 的 单元 写 人 寄存 器 组 A, 以 2 结 
尾 的 单元 写 人 寄存 器 组 B。 

两 个 交叉 通道 ( 1x, 2x) 可 以 使 一 个 数据 通道 中 的 功能 单元 访问 在 另 一 个 数据 通道 土 存 器 组 
中 的 一 个 32 位 的 操作 数 ， 在 每 个 周期 内 有 一 个 交叉 通道 数据 读 到 的 最 大 次 数 。 一 个 数据 通道 中 
的 每 个 功能 单元 可 利用 一 个 交叉 通道 访问 男 一 个 数据 通道 中 的 寄存 器 数据 (也 就 是 说 ,一 个 通道 
中 的 功能 单元 能 够 访问 另 一 个 数据 通道 中 的 寄存 器 )， 共 有 32 个 通用 寄存 器 ， 但 其 中 有 些 寄存 器 
用 于 特定 寻找 方式 或 条 件 指令 。 


34 取 指 和 执行 包 


TI 公司 推出 的 VELOCITI £&fHECF VLIW 结构 ， 一 个 执行 包 (EP ) 由 一 组 在 相同 时 钟 周 期 
时 间 内 能 并 行 执行 的 指令 组 成 。 在 一 个 取 址 包 CFP) A, EP 的 个 数 可 以 从 1 个 (EP 内 有 8 条 并 
行 指令 } 到 8 个 CEP 内 没有 并 行 执 行 指令 ， 每 个 执行 包 只 有 一 个 指令 ) 改进 的 VLIW /结构 允许 
一 个 EP Af EP. 

每 个 32 位 指令 的 最 低 有 效 位 用 来 确定 下 一 条 或 后 续 的 指令 是 否 属于 同一 个 EP( 当 其 为 1 时 ) 
或 是 下 一 个 EP 的 一 部 分 ( 当 其 为 0 时。 假设 一 个 FP 有 三 个 EP，EP1 《 育 两 条 并 行 的 指令 入 
EP2 和 EP3， 后 两 个 都 有 三 条 并 行 的 指令 ， 三 个 EP 分 别 如 下 所 示 : 


Instruction A 
\| Instruction B 


Instruction C 
|| Instruction D 
li Instruction E 


Instruction F 
i] Instruction G 
| Instruction H 


EP] 包含 两 个 并 行 指令 AA B, EP2 包含 三 条 并 行 指 令 C，D 和 BE，EP3 包含 三 条 并 行 指令 
FGH., FP 如 图 3.3 所 示 , 每 个 32 位 指令 的 第 0 比特 位 (也 就 是 最 低 有 效 位 ) 是 位 p, 该 比特 
位 用 来 表示 这 条 指令 是 否 和 后 续 指 令 并 行 执行 。 举 一 个 例子 ， 假 设 指令 B 的 p 位 是 0， 表 明 它 和 
后 继 指令 CC 不 在 相同 的 EP 内 。 同 样 地 ， 指 令 E 和 指令 F 也 不 在 相同 的 EP 内。 


31 0 3l 0 31 Üü 31 0 31 D 31 0 31 0 31 0 Sls 
it of iT 11 of Ti] 1|] | 
| A B C D E F G H 
图 3.3 食 有 三 个 执行 包 的 FP 及 其 与 p 位 关系 


35 流水线 技术 


流水 线 操作 技术 是 数字 信号 处 理 器 的 重要 特点 ， 它 可 以 使 指令 正确 地 并 行 工作 ， 但 需要 仔细 
考虑 定时 间 题 。 流水 线 操作 过 程 包括 三 个 状态 周期 ; 取 指 令 周 期 、 指 令 译 码 周期 和 指令 执行 周期 ， 


1. 取 指 令 周 期 包括 4 个 时 钟 周期 : 
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(a) PG, (在 CPU 中 ) 产生 取 指 的 程序 地 址 。 

(b) PS, 程序 地 址 送 到 程序 存储 器 地 址 线 上 。 

(c) PW， 程 序 地 址 准备 好 ， 等 待 读 程序 存储 器 。 

(d) PR, (CPU 中 的 ) 程序 取 指 包 从 程序 存储 器 读 取 操作 码 。 

2， 指 令 译 码 周期 包括 两 个 时 钟 周期 : 

(a) DP, 将 一 个 FP 中 的 指令 分 别 分 发 到 合适 的 功能 单元 。 
(b) DC， 指令 译 码 。 

3， 执 行 周 期 包含 的 时 钟 周期 和 指令 及 处 理 器 有 关 ， 执 行 周期 时 间 从 6 个 时 钟 周 期 (对 于 定 
点 处 理 器 ) 到 10 个 时 钟 周期 【对 于 淫 点 处 理 器 )， 延 迟 时 间 和 执行 的 指令 有 关 
(a) 乘法 指令 (Multiply )， 占 用 两 个 时 钟 周 期 ， 其 中 一 个 时 钟 周 期 是 延迟 时 间 。 
(b) 赋值 指令 (Load )， 占 用 5 个 时 钟 周 期 ， 其 中 4 个 时 钟 局 期 是 延迟 时 间 。 
(c) 分 支 指令 (Branch )， 占 用 6 个 时 钟 周期， 其 中 5 个 时 钟 周期 是 延迟 时 间 。 


表 3.2 给 出 了 流水 线 操作 的 三 个 状态 局 期 de 3.3 给 出 了 流水 线 操作 的 过 程 以 及 结果 。 表 3.3 
的 第 一 行 表示 时 钟 周 期 1, 2, …, 12， 下 面 的 每 一 行 代表 一 个 FP。 行 中 用 PG, PS, … 表 示 每 个 取 指 
周期 FP 的 不 同时 钟 周期 , 第 一 个 FP 的 PG 时 钟 周期 从 第 一 个 时 钟 周期 开始 , 第 二 个 FP 的 PG 时 
钟 周期 从 第 二 个 时 钟 周期 开始 ， 依 次 类 推 。 每 个 FP 用 4 个 时 钟 周期 取 指 令 ， 两 个 时 钟 周期 指令 
译 码 , 但 指令 执行 状态 周期 可 能 占用 1 到 10 个 时 钟 周期 ( 表 3.3 没有 给 出 执行 状态 周期 里 全 部 的 
时 钟 周 期 )， 我 们 假定 每 一 个 FP 包含 一 个 EP。 

例如 ， 在 第 7 个 时 钟 周 期 第 一 个 FP 中 的 指令 在 指令 执行 周期 第 一 个 时 钟 周期 ( 指令 执行 
状态 周期 可 以 只 有 一 个 时 钟 周期 )， 第 二 个 FP 的 指令 处 于 指令 译 码 状 态 时 钟 周期 , 第 三 个 FP 的 
指令 处 于 指令 分 发 时 钟 周期 等 ， 所 有 的 7 个 指令 都 运行 在 不 同 的 状态 周期 ， 因 此 在 第 7 个 时 钟 局 
期 ,流水线 是 “ 满 负 荷 ”的 ， 也 就 是 说 ， 从 第 7 个 时 钟 周 期 开始 ， 流 水 线 上 时 钟 有 7 条 指令 在 并 
行 执行 着 。 

32 流水 线 各 个 状态 周期 


程序 获取 E m A 行 
PG PS PW PR DP: DC E1-E6 ( EL-E10 用 于 双 精 度 ) 








R33 ”流水线 操作 过 程 和 结果 











时 钟 周期 
1 2 5 6 7 8 9 10 lt 12 
PG PS PW PR DP DC El E2 E3 E4 E5 E6 
PG PS PW PR DP DC El E2 E3 EA ES 
PG PS PW PR DP DC El E2 E3 E4 
PG PS PW PR DP DC Ei E2 E3 
PG PS Pw PR DP DC El E2 
PG PS PW PR DP pc El 
PG PS PW PR DP DC 
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大 部 分 指令 执行 周期 只 有 一 个 时 钟 局 期 , 有 些 指令 占用 较 多 的 时 钟 周 期 , 如 乘法 指令 ( MPY ), 
数据 传输 指令 (LDHALDPW ) 和 分 支 指令 (BO 分 别 占 用 2 个 、5 个 和 6 个 时 钟 周期 。 指 令 执 行 需 
要 的 额外 时 名 局 期 与 指令 的 浮 点 和 双 精 度 类 型 操作 是 有 关 的 ， 有 时 占用 时 间 达 到 10 个 时 钟 周期 。 
例如 ， 在 C67x 上 实现 双 精 雇 屁 法 操作 (MPYDP )， 需 要 9 个 延迟 时 钟 周期 ， 因 此 加 个 执行 状态 
周期 需要 10 个 时 钟 周期 。 

功能 单元 的 等 待 时 间 表 示 一 条 指令 绑 定 某 个 功能 单元 时 所 占用 的 时 钟 周 期 数 ， 除 了 C67x R. 
有 的 双 精 度 指令 外 ， 所 有 指令 的 功能 单元 延迟 时 间 都 是 一 个 时 钟 周 期 。 功 能 单元 的 等 待 时 间 和 延 
IRS BEA. Gon MPYDP 指令 有 4 个 功能 单元 的 等 待 时 间 ， 却 需要 9 个 时 钟 周 期 ， 这 
意味 着 其 他 指令 在 4 个 时 钟 周期 内 不 能 使 用 相关 的 功能 单元 。 一 个 数据 保存 指令 设 有 延迟 时 钟 周 
期 但 在 流水 线 操作 的 第 三 个 时 钟 周期 才 结 束 执 行 。 

如 果 篆 法 指令 的 结果 (例如 MPY 指令 ) 被 下 一 条 指令 中 用 到 ， 为 了 使 流水 线 正常 工作 ,就 
必须 在 MPY 之 后 插入 NOP COSME) 指令 。 当 指令 中 用 到 一 个 数据 传输 或 分 支 指令 的 结果 时 ， 
分 别 需要 揪 人 4 个 或 5 个 NOP 指令 。 


36 寄存 器 


共有 两 个 害 存 器 组 ， 每 组 有 16 个 可 访问 的 寄存 器 ，A 组 寄存 器 包括 AO-ATS, B 组 寄存 器 包 
插 BO0~B15。 寡 存 跨 A0，A1，B0，B1，B2 是 条 件 寄存 器 ,寄存 器 A4-AT7, B4~B7 是 用 于 循环 寻 
址 的 寄存 器 ， 寄 存 器 A0~A9 和 B0~B9 ( BR B3 外 ) 用 做 临时 寄存 器 。A10~A15 以 及 B10~B15 的 
任何 寄存 器 用 于 从 子 程序 返回 时 数据 的 保存 和 恢复 ， 类 似 于 堆栈 操作 时 所 用 到 的 存储 器 。 

一 个 40 位 的 数据 可 保存 在 寄存 器 对 中 ， 低 32 位 存放 在 倡 害 存 器 中 (例如 A20, WFA S dV 
存储 在 相仿 的 高 ( 奇 ) 地 址 寄存 器 中 (A3 )。 对 64 位 双 精 度数 据 ， 也 可 以 采用 同样 的 方法 ， 有 分 
别 用 奇偶 寄存 器 对 来 存储 数据 。 

这 32 个 寄存 器 可 以 当做 通用 寄存 器 ， 一 些 特殊 功能 寄存 器 还 可 用 于 控制 和 中 断 ， 如 附录 B 
所 示 ， 地 址 模式 寄存 器 ( AMR ) 用 循环 寻 址 和 中 断 控制 寄存 器 。 


37 ”线性 和 循环 寻 址 方式 


寻 址 模式 决定 了 访问 存储 器 的 方式 ， 规 定 了 如 何 访问 数据 ， 例 如 间接 地 从 存储 单元 获得 一 个 
操作 数 。TMS320C6x 支持 线性 和 循环 寻 址 方式 ， 最 常用 的 寻 址 方式 是 存储 器 间接 寻 址 方式 。 


37.3 间接 寻 址 


间接 寻 址 方式 可 以 和 有 偏 移 及 无 仿 移 寻 址 方式 一 起 使 用 ， 寄 存 器 R 表示 A0-A15 和 B0~B15 
的 32 个 寄存 器 中 的 任何 一 个 霖 存 器 ， 用 寄存 器 指定 或 扒 向 一 个 存储 器 单元 地 址 ， 因 此 这 些 寄存 
器 内 容 就 是 地 址 指针 。 间 接 寻 址 通过 在 32 个 寄存 器 中 的 任何 一 个 寄存 器 前 面 加 上 星 号 来 表示 。 
ATRAE, BiR 是 一 个 地 址 害 存 器 ， 下 面 不 同 的 表示 方法 具有 不 同 的 意义 ， 


1. *R. BAN BFE R 中 存放 的 是 存储 某 个 数据 的 存储 单元 地 址 。 

2.，“R+HG。 表 示 寄 存 器 及 中 存放 存储 单元 的 地 址 指针 ， 当 访问 完 寄 存 器 R 指针 对 应 的 存储 
单元 后 , R 寄存 器 的 指针 就 改变 ， 寄存器 R 内 新 指针 值 是 原来 的 指针 值 加 上 偏 移 量 de 如 
d= 1 (RAH) 新 的 指针 值 就 是 R + 1 ， 即 R 的 值 就 变 为 相 邻 的 高 地 址 。 如 果 用 两 
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个 减 号 (一 ) 代替 前 面 的 两 个 加 导 (4), 结果 正好 相反 ,地 当 访问 完 寄 存 器 RR 指针 对 应 
的 存储 单元 后 ,寄存器 R 内 新 指针 值 是 原来 的 指针 值 减 去 偏 移 量 4，R 的 什 变 为 Rd 
3. HRO). 表示 地 址 指针 先 加 上 偏 移 量 4， 因 此 当前 的 地 址 指针 是 RR+ d。 如 果 使 用 两 个 减 
号 (一 )， 则 先 碱 去 当前 的 偏 移 量 ， 这 时 当前 的 地 址 指针 变 为 RR 一 d， 
4. “+R(4)。 表 示 地 址 指针 先 加 上 2， 因 此 当前 的 地 址 指针 是 R + d (这 和 前 面 的 表示 方法 是 
一 样 的 )。 但 在 这 种 情况 下 ，R 先 加 仿 移 量 后 仅 用 于 寻 址 ， 但 是 R 的 内 容 本 身 并 不 改变 ， 
这 和 前 面 的 表示 方法 是 不 同 的 。 


3.7.2 ”循环 导 址 


循环 寻 址 用 于 创建 环形 缓冲 区 ,这 种 缓冲 区 通过 谭 件 方法 来 实现 , 在 一 些 DSP 算法 中 这 种 
方法 是 非常 有 用 的 。 例 如 在 数字 滤波 或 相关 运算 中 ， 数 据 需要 不 断 更 新 ， 这 时 利用 环形 缓冲 区 
是 一 种 比较 好 的 方法 ， 第 4 章 给 出 了 一 个 利用 环形 缓冲 区 更 新 “延迟 ”抽样 ， 实现 数字 滤波 的 
BET. 

Cóx 采用 专门 的 硬件 实现 循环 寻 址 方式 ， 这 种 等 址 方式 可 以 和 环形 缓冲 区 一 起 使 用 ， 通过 移 
动 数 据 实现 抽样 值 的 更 新 , 而 消 除了 没有 环形 缓冲 区 直接 移动 数据 所 产生 的 开销 (Overhead )。 当 
指针 到 达 环 形 组 促 区 的 末端 或 底部 位 置 时 ， 即 指 针 指 到 缓冲 区 最 后 一 个 数据 时 ， 这 时 指针 就 会 增 
大 ， 且 自动 转 回 到 或 指向 鱼 串 区 的 开始 位 置 或 顶部 ， 即 缓冲 区 中 的 第 一 个 数据 位 置 。 

如 附录 B 所 示 ， 在 地 址 模式 寄存 器 ( AMR) 中 有 两 个 独立 的 环形 缓冲 区 ， 通 过 使 用 BKO 和 
BK1 来 实现 。A4~A7，B4-B7 AY 8 个 寄存 哄 和 两 个 了 功能 单元 可 用 做 指针 ( 所 有 寄存 器 可 用 于 
线性 寻 址 )。 下 面 的 程序 代码 段 介 绍 了 如 何 借 助 寄存 器 B2 ( 只 有 了 组 寄存 器 能 够 使 用 》 使 用 环形 
缓冲 区 并 在 AMR 内 设 定 合 适 的 值 ， 

MVK .S2 0x0004,B2 lower 16 bits to B2. Select A5 as pointer 
MVKLH .S2 0x0005,B2 ;upper 16 bits to B2. Select BO, set N =5 
MVC .82 B2,AMR ;move 32 bits of B2 to AMR 

两 条 数据 搬移 指令 MVK 和 MVKLH (使 用 .S 单元 ) 将 0x0004 送 到 害 存 器 B2 的 低 16 fir, 
将 0x0005 送 到 寄存 器 B2 的 高 16 1%, MVC ( 常数 据 移 ) 指令 是 惟一 一 条 能 够 访问 AMR 和 其 
他 控制 寄存 器 ( 参见 附录 BO 的 指令 ， 并 且 只 能 与 B 组 的 功能 单元 和 寄存 器 在 B 组 寄存 器 上 
进行 操作 。 首 先 给 B2 赋 一 个 32 位 的 数据 ， 然 后 通过 MYC 指令 访问 AMR， 将 该 数据 传送 到 
AMR Hall : 

数据 0x0004 =(0100), BEA AMR 寄存 器 的 低 16 位 ， 即 AMR 寄存 器 的 位 2 (也 就 是 第 三 位 ) 
设置 为 1， 其 他 比特 位 都 设 为 0， 这 样 就 将 模式 设置 为 01 ， 审 存 器 AS TEES ERK (948 
fF, mi BKO Be EO IER x ， 

3€ 3.4 给 出 了 与 寄存 器 A4-A7 和 B4~B7 的 相关 模式 , 0x0005 =(010Ih 赋 给 AMR 的 高 16 位 ， 
即将 AMR 寄存 器 的 位 16 和 位 18 设置 为 1. 其 他 比特 位 设置 为 0， 该 数 对 应 缓冲 区 的 天 小 ,用 
BKO 作为 环形 缓冲 区 ， 由 于 高 16 位 对 应 的 数 = 5, 因此 缓冲 区 的 容量 为 2**1= 64 字 节 。 例 如 ， 
如 果 息 用 BKO 得 到 一 个 容量 为 128 字 节 的 缓冲 区 , AMR 的 高 16 位 应 设置 为 (0110)。 = 0x0006., 如 
年 使 用 汇编 程序 对 环形 缓冲 区 进行 操作 ， 当 该 汇编 程序 段 执行 完成 后 ,程序 返回 到 -个 C HNR 
数 ， 这 时 AMR 寄存 器 就 要 被 重新 初始 化 为 默认 的 线性 模式 ， 因 此 为 了 进行 正确 的 运算 ， 必 须 保 
存 指针 的 地 址 。 
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#34 AMA 的 可 用 楼 式 必 其 作用 


Box 说 M 

00 ATARE ORUA) 
01 用 于 周期 寻 址 ， 司 用 BKO 
10 用 于 周期 寻 址 ， 使 用 BKI 

1i IBI 
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3.8.1 汇编 语句 格式 
汇编 语句 格式 可 用 下 面 的 结构 表示 : 
Label || [ ] Instruction Unit Operands ;comments 


如 果 有 标号 的 话 ， 它 表示 一 个 特殊 的 地 址 或 者 是 包含 指令 或 数据 的 存储 单元 地 十 ， 标 号 必须 
从 第 一 列 开始 。 并 行 双 竖 线 表示 当前 指令 是 否 积 前 面 的 指令 并 行 热 行 。 后 面 的 [字段 是 可 选项 ， 
它 使 相关 指令 是 有 条 件 的 ， 而 A1，A2，B0，Bi 和 B2 可 用 杖 条 件 寄 存 器 。 例 如 ，LA2] 表 示 如 果 
[A2] 不 为 0， 出 执行 相关 指令 。 相 反 使 用 [!A2]， 表 示 如 果 A2 为 0 时 ， 则 执行 相关 的 指令 。 所 有 
Céx 的 指令 都 可 用 A1, A2, BO, BI 和 B2 作为 条 件 寄存 器 ， 通 过 判断 它 是 否 为 0 Bog ROS BUR 
相关 指令 。 指 令 段 可 以 是 汇编 器 指令 或 者 是 汇编 指令 的 助 记 符 ， 汇 编 器 指令 就 是 汇编 器 的 命令 ， 
例如 .word value 表示 保留 一 个 32 位 的 存储 单元 ， 在 该 存储 单元 内 存储 指定 的 数据 value。 助 记 符 
是 DSP 工作 时 一 条 真正 执行 的 指令 ， 助 记 符 或 汇编 器 指令 不 能 从 第 一 列 开 始 。Unit 段 是 可 选 的 ， 
它 可 以 是 CPU 内 8 个 功能 单元 中 的 任 一 个 单元 。 当 注释 语句 从 第 一 列 开 始 时 , 语句 前 面 可 以 用 分 
号 或 星 号 ， 而 从 其 他 列 开 始 的 注释 语句 ， 必 须 在 注释 语句 前 面 用 分 号 。 

PEORES C3x/C4x 的 指令 和 定点 处 理 器 Clx, C2x. C5x/C54x 的 指令 是 不 兼容 的 ， 但 定 
点 处 理 器 C62x 的 指令 与 浮 点 处 理 器 C67x 的 指令 是 兼容 的 。C62x 指令 实际 上 是 C67x 指令 的 子 
R, RA C67x 处 理 器 才 有 处 理 双 精度 各 浮 点 操作 的 附加 指令 ( 一 些 附加 指令 在 定点 处 理 器 C64x 
上 也 有 》。 

为 了 说 明 Cox 指令 集 ， 书 中 给 出 了 一 些 程序 代码 段 。C6x 处 理 器 汇编 指令 和 C3wCdx 的 指令 
很 相似 ，C62x/C67x 的 单 任务 指令 使 其 比 以 前 的 定点 或 浮 点 处 理 器 更 容易 编程 ， 这 应 归功 于 高 效 
编译 器 。C64x 的 附加 指令 (C62x 上 没有 的 ) 和 C3xC4x 处 理 器 的 过 任务 类 型 指令 相似 。 阅 读书 
中 所 讨论 程序 的 注释 部 分 对 理解 程序 是 大 有 帮助 的 ， 附 录 B 给 出 了 C62xC67x 的 指令 集 。 


3.82 ”指令 类 型 


下 面 说 明 汇编 程序 的 语法 规划 ， 尽 管 8 个 功能 单元 指定 字段 是 可 选 的 ， 但 在 程序 调试 和 提高 
程序 效率 、 优 化 程序 方面 ， 还 是 非常 有 用 的 。 关 于 这 一 点 ， 将 在 第 8 章 中 进行 讨论 。 
t. HE. BUA ARS 
(a) ADD .L1 A3,A7,A7 ;add A3 + A7 >A7 (accum in A7) 
将 寄存 器 A3 和 A7 中 的 内 容 相 加 ,并 将 结果 放 到 寄存 器 A7 中 。 功能 单元 .LI 是 可 选 
项 ， 如 果 结 果 放 在 寄存 器 BO 中 ， 则 使 用 功能 单元 .1L2。 
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(b) SUB .S1 A1,1,A1 ;subtract 1 from Ai 


使 用 .S 功能 单元 ， 将 寄存 器 AT 内 容 减 去 1， 结 果 存 放 到 寄存 器 Al 中 ， 实 现 递减 。 
(c) MPY .M2 A7,B87,B6 ;multiply 16LSBs of A7,B7 一 B6 
i| MPYH .M1 A7,B7,A6 multiply 16MSBs of A7,B7 — A6 


这 是 在 同一 个 指令 包 中 的 两 条 并 行 热 行 指令 ， 第 一 条 指令 是 害 存 器 A7 和 B7 的 最 低 
16 位 相 葬 并 将 结果 存在 寄存 器 Bo 中 , 第 二 条 指令 将 寄存 器 A7 和 B? 的 高 16 位 相 
He, BRAD ARR AG 中 。 在 这 种 情况 下 , 两 个 乘法 /加 法 操作 可 在 单个 指令 周期 
内 完成 , 这 可 用 于 将 一 组 积 的 和 分 解 成 两 组 积 的 和 : 一 组 用 低 16 位 对 1,3, 5, … 进 
行 运算 ， 另 一 组 用 高 16 位 对 2, 4, 6, … 进 行 运算 ， 注 意 并 行 指令 标识 符号 “IP” 不 能 
放 在 第 一 列 上 。 
. 数据 传送 指令 
(a) LDH .D2 *B2++,B7 ;load (B2) 3B7,increment B2 
l| LDH .D1 *A2++,A7 iload (A2) 4A7,increment A2 
第 一 条 指令 将 寄存 器 B2 所 指定 的 存储 单元 的 半 字 〈 16 位 ) 存放 到 B7， 然 后 B2 的 
内 容 加 上， 指向 下 一 个 高 地 址 单元 ;同样 另 一 个 间接 寻 址 的 并 行 指令 将 寄存 器 A2 所 
指定 的 存储 单元 的 内 容 传送 到 老人 存 器 AT, 寄存 器 A2 的 内 容 再 加 1， 指 向 相 邻 的 下 
一 个 高 地 址 单元 。 
指令 LDW 可 以 传送 一 个 2 位 的 字 。 EH LDW 指令 以 及 功能 单元 .D1 和 .D2， 
可 将 存储 器 中 的 数据 传送 到 寄存 器 A 和 寄存 器 B 中 。C6711 的 双 字 泽 点 传送 指令 
LDDW 可 将 两 个 32 位 的 寄存 器 数据 传送 到 A 组 寄存 器 , 同时 将 两 个 32 位 的 寄存 器 
数据 传送 到 B 组 寄存 器 。 
(b) STW .D2 Al,*+A4[20] ;store Al—(A4) offset by 20 
将 寄存 器 Al 中 的 32 位 字 存 储 到 地 址 为 寄存 器 A4 所 指定 且 偏 移 20 F (32 位 的 字 ) 
或 80 字 节 的 存储 单元 。 地 址 寄存器 A4 先 加 上 篇 移 值 ， 但 是 寄存 器 的 内 容 并 不 改变 
(如果 改 变 A4 的 值 ， 在 寄存 器 前 看 使 用 两 个 加 号 )。 


分支/ 数据 移动 指令 
下 面 的 程序 指令 段 说 明了 分 支 和 数据 移动 指令 的 用 法 ; 
Loop MVK .51 x,A4 move 16LSBs of x address A4 


MVKH .S1 x,aA4 nove 16MSBs of x address A4 


SUB .S1 Al1,1,A1 ;decrement Al 
[A1] B .82 Loop ;branch to Loop if A1 0 

NOP 5 five no-operation instructions 

STW .D1 A3,*A7  ;store A3 into (A7) 
第 一 条 指令 将 地 址 为 x 的 存储 单元 低 16 位 (LSB) 传送 到 寄存 器 A4, 第 二 条 指令 将 地 址 
为 x 的 存储 单元 高 16 位 (MSR ) 传送 到 寄存 器 A4。 寄 存 器 AA 现在 存 有 地 址 为 x 单元 的 
全 部 32 位 数据 。 为 了 给 寄存 器 赋 一 个 32 位 的 常数 ， 必 须 使 用 MVKIMVKH 指令 。 

寄存 器 Al 用 做 循环 计数 器 。 随 着 SUB 指令 的 执行 , 其 数值 逐步 递 臧 , 使 用 该 数值 





58 DSP RRAK C 编程 开发 技术 


来 判断 是 否 需要 转移 。 如 果 Al 不 为 0， 则 执行 loop HRAMA, AM CH Al 等 
于 0)， 继 续 执行 猪 环 体外 程序 指令 段 ， 将 寄存 器 A3 中 的 数据 传送 到 A7 指定 地 址 的 存 
储 单元 中 。 


3.9 汇编 器 指令 


汇编 器 指令 就 是 给 汇编 器 ( 而 不 是 编译 器 ) 的 信息 ， 它 并 不 是 程序 指令 ， 而 只 是 在 汇编 过 程 
中 被 汇编 器 执行 的 指令 ， 所 所 不 像 指令 那样 占据 存储 器 空间 。 汇 编 器 指令 不 会 产生 可 执行 代码 ， 
它 可 用 来 指定 不 同 程序 段 的 地 址 。 例 如 ,汇编 器 指令 .sect “my buffer" EX. T 4479 my. buffer 的 
数据 或 程序 代码 段 ,指令 text 和 ,data 分 别 表示 文本 筑 和 数据 段 定义 指 令 ,其 他 汇编 指令 如 .ref 和 .def 
分 别 用 来 表示 未 定义 符号 和 定义 符号 。 汇 编 器 通过 汇编 指令 来 建立 不 同 的 段 ， 例 如 通过 .text 建立 
程序 代码 段 ，.bss 用 于 建立 全 局 变量 或 静态 变量 。 

其 他 常用 的 汇编 器 指令 有 : 


1. shot, EX 16 位 整 型 数 。 

2. int, EA 32 位 整 型 数 (还 有 .word sX long )。 编 译 器 认为 长 整 型 数 是 40 位 的 ， 而 C6x 编 
译 体 长 整 型 数 是 32 位 的 。 

3. float, 3E X. 32 位 的 IEEE 单 精度 常数 。 

4. double, iE X. 64 位 的 EEE 双 精 度 常数 。 


通过 汇编 器 指令 .byte，.short 或 .int 可 给 变量 赋 初 始 值 ， 使 用 指令 .usect 可 以 定义 未 初始 化 的 
段 (如 .bss Et), TBS sect 建立 初始 化 的 段 。 例 如 ， 命 令 .usect “variable” , 128, 2 分 别 指定 名 
为 variable 的 未 初始 化 段 ， 段 的 大 小 以 字 节 为 单位 并 按 字 节 进 行 对 齐 。 


3.10 ”线性 汇编 


除了 C 语言 和 汇编 程序 外 , 还 有 一 种 方法 就 是 线性 汇编 。 汇编 优化 器 代替 C 编译 器 ， 它 和 线 
性 汇编 源 程序 (扩展 名 为 .sa ) 结合 起 来 生成 汇编 源 程序 ( 扩展 名 是 .asm ), 这 与 C 编译 优化 器 和 
源 程 序 代码 相 结 合生 成 汇编 程序 在 很 大 程度 上 是 相同 的， 但 用 汇编 优化 器 生成 的 汇编 程序 比 用 C 
编译 优化 程序 生成 的 汇编 程序 效率 更 高 , 由 C 语言 源 程序 和 线性 汇编 产生 的 汇编 源 程序 必须 经 过 
汇编 后 才能 生成 目标 代码 。 

线性 汇编 编程 方法 在 编程 所 需 时 间 和 程序 代码 效率 两 者 之 间 实 现 了 较 好 的 折 中 ,汇编 优化 器 
确定 使 用 哪些 功能 单元 和 寄存 器 也 可 以 由 用 户 来 指定 )， 查 找 可 并 行 执行 的 指令 ， 并 进行 软件 
流水 线 操作 优化 (第 8 章 将 讨论 该 问题 )。 本 章 的 结尾 部 分 介绍 了 两 个 编程 实例 , 用 来 说 明 用 C 程序 
如 何 调 用 一 个 线性 汇编 函数 。 在 线性 汇编 程序 中 ， 并 行 指 令 是 无 效 的 。 和 汇编 程序 一 样 ， 在 线性 
汇编 程序 中 可 以 选择 指定 使 用 哪些 功能 单元 。 

经 过 多 年 的 发 展 ，C 编译 优化 器 的 效率 已 经 越 来 越 高 。 虽 然 C 语 言 程序 比 汇编 语言 程序 ( 在 
执行 速度 方面 ) 效率 低 ,但 它 比 汇编 程序 更 省 时 省 力 ， 易 于 开发 。 对 CC 语言 程序 也 可 用 手动 优化 
以 达到 百分之百 的 效率 ， 但 编程 比较 费时 。 

值得 注意 的 一 个 有 趣 现象 是 : C6x 的 汇编 程序 语法 并 不 像 C2x/C5x 或 C3x 系列 数字 信号 处 理 
器 那样 复杂 。 实 际 上 ， 使 用 汇编 语言 对 C6x 进行 编 称 是 比较 简单 的 。 例 如 ，C3x 指令 ， 
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DBNZD AR4, LOOP : 
第 一 个 D 表示 循环 计数 器 AR4 递减 ， 第 二 个 D 表示 延迟 ， 如 果 AR4 AHO, 分 支 CBO 转移 到 
LOOP 指定 的 地 址 。 由 于 采用 流水 线 技术 , 具有 延迟 的 分 支 指令 可 在 一 个 时 钟 周期 内 高 效 地 执行 ， 
虽然 Cox 没有 这 种 多 任务 指令 (虽然 最 近 C64x 有 这 种 指令 ), 但 是 实际 上 , Cox 的 指令 更 “简单 "。 
例如 ， 有 单独 的 指令 可 使 计数 器 递减 (用 SUB 指令 ) 和 转 称 ,这些 简单 的 指令 适合 于 用 高 效 的 CC 
编译 器 进行 编译 。 

虽然 使 用 汇编 语言 进行 编程 ， 实 现 预 期 的 任务 是 非常 简单 的 ， 但 这 并 不 意味 着 很 容易 就 能 纺 
写 或 把 程序 转变 成 高 效 的 汇编 语言 程序 。 手 动 优化 生成 完全 高 效 的 汇编 语言 程序 是 非常 有 意义 
的 ,但 相对 来 说 比较 内 难 。 

线性 汇编 语言 是 汇编 语言 编程 和 心 语言 编程 结合 的 中 间 产 物 , 它 使 用 汇编 指令 语法 :如 ADD, 
SUB, MPY, 但 操作 数 /寄存 器 和 CC 语言 中 使 用 的 一 样 。 在 某 些 情况 下 , 使 用 线性 汇编 是 在 选择 C 
语言 和 汇编 语言 编程 之 间 的 折 中 。 

线性 汇编 器 指令 包括 : 


.Cproc 
.endproc 


它们 用 来 指定 一 个 C 可 调用 程序 或 汇编 优化 器 优化 的 一 段 代 码 ， 另 一 个 指令 meg 用 于 声明 变量 和 
定义 保存 在 寄存 器 中 的 数据 名 。 本 章 后 面部 分 将 用 程序 实例 说 明 如 何 用 C 调用 汇编 语言 函数 或 C 
调用 线性 汇编 隔 数 . 


3.11 在 CC 程序 中 使 用 汇编 语句 


汇编 指令 和 命令 可 以 嵌 人 在 C 程序 中 ， 并 用 asm 语句 来 声明 。asm 语句 可 以 访问 硬件 ， 而 映 
FAC 语言 是 很 难 直接 访问 硬件 的 。 使 用 asm 语句 的 语法 是 : 

asm ("assembly code"); 

在 引号 内 的 每 行 汇编 程序 语句 应 该 是 有 效 的 汇编 语句 。 注 意 : 如 果 指 令 有 标号 ， 标 号 的 第 一 
个 字母 必须 跟 在 第 一 个 引号 后 面 , 这 样 可 使 标号 从 第 一 列 开 始 。 汇编 语句 必须 是 合法 有 效 的 语句 ， 
因为 编译 器 并 不 检查 它 的 语法 错误 ， 而 是 将 它 直接 复制 到 编译 的 输出 文件 里 。 如 果 汇 编 语句 有 语 
法 错误 的 话 ， 汇 编 器 将 会 查 出 来 。 

应 尽 基 避免 在 C 程序 中 使 用 asm TA], 特别 是 线性 汇编 程序 中 。 这 是 因为 汇编 优化 器 可 能 在 
asm 语句 附近 重新 安排 程序 语句 的 位 置 ， 这 样 就 可 能 导致 意 想不到 的 错误 。 


3.12 C 可 调用 汇编 函数 


本 章 后 面 举 了 两 个 例子 ， 说 明 用 C 程序 如 何 调用 汇编 函数 。 寄 存 器 B3 保留 下 来 ， 用 于 保存 
调用 函数 的 返 加 地址 。 
在 C E HPLC AR GRE, RTI extern 语句 作为 函数 的 外 部 声明 ， 如 : 


extern int func(); 


(LR PRX func 返回 一 个 整数 值 ， 该 语句 是 可 选 的 。 
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3.13 ERS 


DSP 内 有 两 个 32 位 的 定时 器 . 可 以 用 来 定时 、 计 数 或 中 断 CPU, 还 能 控制 外 部 ADC 开始 转 
换 或 控制 DMA 控制 器 进行 数据 传送 。 定 时 器 包括 时 钟 周期 寄存 器 、 定 时 计数 寡 存 器 和 定时 控制 
寄存 器， 时 钟 周期 寄存 器 用 来 确定 定时 器 工作 的 时 钟 频 率 ， 定 时 计数 寄存 器 用 来 保存 计数 值 ， 定 
时 控制 寄存 器 用 来 监视 定时 器 的 状态 。 


314 中断 


中 断 可 以 由 内 部 或 外 部 触发 , 发 生 中 断后 将 暂时 停止 CPU 当前 的 进程 , 而 转 人 执行 中 断 所 触 
发 的 特定 任务 ， 程 序 指针 转向 中 断 服 务 程序 ， PRAT ADC, ERS. ET PRS E 
序 前 ,必须 保存 当前 的 进程 状态 ， 以 便 中 断 服务 程序 执行 完 后 返回 主 程序 时 ， 恢 复 进入 中 断 服务 
程序 前 的 进程 状态 ， 即 保存 相关 寄存 器 的 状态 ， 继 续 执行 中 断 服 务 程序 ， 当 中 断 服务 程序 执行 完 
后 ， 青 恢复 原先 寄存 器 的 状态 。 . 

共有 16 个 中 断 源 ， 包 括 两 个 定时 器 中 断 、4 个 外 部 中 断 、4 个 McBSP 中 断 以 及 4 个 DMA 
中 断 。 有 12 个 CPU 中 断 可 供 使 用 ， 它 们 通过 中 断 选 择 器 进行 选择 。 


3.14.1 中断 控制 寄存 器 
中 断 控制 寄存 器 (参见 附录 了 B ) 如 下 ， 


.CSR 控制 状态 寄存 器 )， 包 含 全 局 中 断 使 能 位 【《GIE ) 和 其 他 控制 /状态 位 。 
. IER ( 中 断 启用 寄存 器 )， 启 用 /禁止 各 个 中 断 。 000000 

，IFR (中断 标志 寄存 器 )， 显 示 中 断 状 态 。 

. ISR (中断 设 置 寄 存 器 )， 设 叶 中 断 悬 挂 。 

. ICR {中断 清除 寄存 器 ARPE. 

. ISTP (中断 服 务 表 指 针 )， 定 位 ISR。 

. IRP CrPIBGRTEHERE )。 

8. NRP ( 非 屏蔽 中 断 返 回 指 针 )。 


中 断 具 有 优先 级 。 复 位 (Reset) 具有 最 高 优先 级 ， 复 位 和 非 屏 项 中 断 (NM) 分 别 具 有 第 一 
优先 级 和 第 二 优先 级 ， 它 们 都 由 外 部 引 脚 进行 控制 。 中 断 使 能 寄存 器 用 于 设置 特定 的 中 断 ， 中 断 
标志 寄存 器 可 用 于 检查 是 否 有 中 断 发 生 以 及 发 生 了 性 种 中 断 。 

和 复位 一 样 ，NMI 是 非 屏 项 中 断 ， 但 NMI 可 通过 CSR 中 的 NMIE 位 使 其 屏 项 (禁止 ) 只 
有 在 复位 或 非 屏 项 中 断 时 , 它 才 被 设 为 0。 如 果 NME 设置 为 0, 0] INT4~INT15 的 所 有 中 断 都 被 
WE, 3E B 介绍 了 各 种 中 断 青 存 器 。 

复位 信号 是 低 电 平 有 效 信号 , 它 用 于 停止 CPU 的 执行 ,而 NMI 信号 用 于 告警 ,通知 CPU 有 
潜在 的 硬件 问题 。12 个 低 优先 级 的 CPU 中 断 是 可 用 的 ， 对 应 于 可 屏蔽 的 中 断 信号 引 脚 ， 
INT4~INT15， 其 中 INT4 的 优先 级 最 高 ，INT15 的 优先 级 最低 。 为 了 能 产生 非 屏 艾 中 断 ， 非 屏 项 
中 断 必 须 使 位 NMIE 为 1 ( 高 电 平 有 效 ); 当 复位 (或 在 NMI 被 先 置 位 后 ) 时 ，NMIE 位 被 清 成 0， 
这 时 就 可 以 产生 复位 中 断 。 . 1 

为 了 能 够 执行 可 屏 项 中 断 ， 控 制 状态 寄存 器 ( CSR ) 中 的 全 局 中 断 启用 位 〈GIE ) 和 中 断 启 


-OCM uu 4d CQ) b — 
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用 寄存 器 ( IER) 中 的 NMIE 位 需要 置 1。CSR 的 位 0、GIE 位 以 及 IER 的 位 1 A NME 位 都 设置 
为 1。 注意, 可 以 利用 CSR 和 -2 相 与 (即使 用 二 进 制 补 码 表示 ,除了 最 低 有 效 位 为 0 外 ,其 他 位 
全 为 1 ) 来 设置 CSR 的 GE 位 为 0， 从 而 实现 全 局 屏蔽 掉 所 有 的 可 屏 项 中 断 。 

对 于 需要 的 可 屏蔽 中 断 ， 应 该 将 对 应 的 中 断 启用 位 【下 ) 也 设置 为 1。 当 中 断 发 生 时 ， 相 应 
Pita attra CFR) 的 标志 位 被 置 为 1， 以 表示 中 断 状 态 的 发 生 。 为 了 能 产生 一 个 可 屏蔽 中 
Wr. ABR PARTIE 


1. GIE 位 置 1。 

2. NME f: E 1. 

.3. THES TE DERE 1. 
4. HAZ IFR 的 位 置 1。 


对 于 一 个 发 生 的 中 断 ，CPU 一 定 不 在 执行 相关 的 分 支 指令 的 延迟 时 隙 中 。 

中 断 服务 表 ( IST ) 如 表 3.5 所 示 ， 该 表 表 示 中 断 的 起 始 单元 地 址 ， 每 个 地 址 单元 对 应 一 个 中 
BHRI EL (FP). 表 中 共有 16 个 FP, 每 个 EP 有 8 条 指令 。 右 边 的 地 址 对 应 于 每 个 指定 中 断 的 
偏 移 量 。 例 如 ， 对 于 中 断 INTI, FE 的 地 址 是 基 址 加 偏 移 量 160h。 因 为 每 个 FP 和 包 售 8 个 32 位 
的 指令 (BN 256 位 ) 或 32 字 节 ， 所 以 表 中 每 个 偏 移 地 址 是 以 20h = 32 递增 的 。 


R35 PRRER 
中 B A B 
RESET 000h 
NMI 020h 
保留 040h 
保留 060h 
INT4 O80h 
INTS DAOh 
INT6 0COh 
INT? OEOb 
INT8 100h 
INT? - 120h 
INT10 ]40h 
INT! 160h 
INT12 180h 
INT13 1AGh 
INT14 ICOh 


INT15 1E0h 
来 源 ; TIAA, 
复位 的 FP 必须 从 0 地 址 单元 开始 ， 但 其 他 中 断 的 FP 可 以 重新 定位 。 重新 定位 地 址 可 通过 
将 地 址 写 到 中 断 服 务 表 指 针 { ISTP ) 害 存 器 的 中 断 服务 表 基 地 址 CISTB ) 寄存 器 ， 如 图 B.? 所 
m. EN, ISTB 为 0。 当 重新 确定 矢量 表 的 位 置 时 ， 需要 使 用 ISTP， 重 新 定位 地 址 是 ISTB 
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加 上 偏 移 量 。: 
表 3.6 给 出 了 选择 指定 类 型 中 断 时 ,中 斯 选择 器 对 应 设 定 的 值 。 中 断 选择 器 设 定 为 01000 F}, 
也 用 于 选择 增强 的 DMA ‘Pt (EDMA_INT ). 


3.6 利用 中 断 选择 器 选择 中 断 


中 断 选 择 器 类 m 说 ë 

00000 DSPINT Eon 0 Bl DSP HE 
00001 + TINTO 定时 器 0 中 断 
00010 TINT1 定时 器 1 中 断 
00011 SD_INT EMIF SDRAM 定时 器 中 断 
00100 EXT_INT4 细部 中 断 引 脚 4 
00101 _EXT_HNT5S 外 部 中 断 引 脚 $ 
00110 EXT INT6 外 部 中 断 引 脚 6 
00111 EXT_INT7 外 部 中 断 引 脚 ? 
01000 DMA_INTO DMA 3838 0 中 断 
01001 DMA INTI DMA 通道 1 中 断 
01010 DMA_INT2 DMA 通道 2 中 断 
01011 DMA INT3 DMA 通道 3 中 断 
01100 XINTO McBSPO 发 送 中 断 
01101 RINTO McBSPO 接收 中 断 
01110 XINTI McBSP1 发 送 中 断 
01111 RINT1 McBSP1 接收 中 断 


软件 定义 的 中 断 INT4~INT15 和 相应 的 物理 中 断 信 号 相对 应 ， 通过 中 断 复 用 寄存 器 IML 和 
IMH 定义 中 断 。 为 了 实现 INT4~INT15 的 相应 中 断 ， 表 3.5 所 示 的 中 断 选 择 值 应 该 存放 在 合适 的 
IML 或 IMH 段 中 中 。 关 于 这 一 点 ， 也 可 参见 支持 文件 C6xdskintermpth。 


3.14.2 XINTO 的 选择 


在 前 面 的 大 部 分 例子 中 ， 都 选择 了 MsBSP0 传输 中 断 。 在 通信 文件 C6xdskinit.c H, WAT 
PRX Config_Interrupt_Selector, 该 函数 在 中 断 头 文 件 Coxinterrupts.h 中 。 从 Cóxinterrupts.h 中 得 到 
相应 的 中 断 选 择 值 CO1100) = OxC (该 5 位 的 选择 值 对 应 于 IMH 寄存 器 的 第 5 位 到 第 9 位 入 


3.14.3 . 中断 响 应 


TACK 和 INUMx ( INUMO-INUM3 ) 是 C6x 引 脚 上 的 信和 号， 表示 中 断 已 经 产生 和 正在 执行 。 
4 个 NUM 信号 用 来 表示 正在 处 理 哪 个 中 断 ， 例 如 ，INUM3 = 1 (MSB), INUM2 = 0, 
INUM1 = 1, INUMO = 1 (LSB) , WA (1011) 。= 11， 表 示 正 在 执行 中 断 INT11。 

E1 设置 为 1 以 使 能 INT11， 通 过 读 取 中 断 标志 寄存 器 可 以 确认 下 11 位 是 否 被 置 为 1 (NTH 
被 启用 )， 从 而 校 验 中 断 是 否 正 在 执行 。 将 中 断 设 置 寄存 器 (ISR) 的 某 位 置 1， 会 使 IPR 中 相应 的 
中 断 标 志 位 置 位 ; 而 将 中 断 清除 寄存 屁 (ICR ) 的 某 位 置 0， 则 会 使 IFR 中 相应 的 中 断 标志 位 清除 。 

当 CPU 执行 到 分 支 指令 的 等 待 延 迟 时 洽 时 ， 所 有 的 中 断 将 保持 悬挂 状态 。 因 为 分 支 指 令 有 5 
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^ RERIIBR, DENT 6 SNA PS EASE Ph. RERA AERE IE aR 
4, CPU SEE AEEUR EB PR, ROM ABST, 
315 ”多 通道 缓冲 串 行 口 

Cox 有 两 个 多 通道 缓冲 串 行 口 ， 它 们 可 以 和 廉价 的 ( 符合 工业 标准 的 ) 外 设 接口 。MsBSP A 
有 全 双 工 通信 、 收 发 独立 时 钟 和 成 帧 以 及 直接 与 AC97 和 IIS 兼容 设备 楼 口 等 特点 ,允许 8~32 位 
数据 进行 传送 。McBSP 有 关 的 输入 输出 时 钟 和 成 帧 参数 技术 指标 可 参见 文献 中 。 

当 内 部 数据 在 传输 时 ， 外 部 数据 也 可 以 进行 通信 , 图 3.4 给 出 了 McBSP 的 内 部 原理 图 。 数据 
发 送 (DX) 和 接收 【DR ) 引 脚 用 于 数据 和 通信， 控制 信号 (时钟 信 号 和 帧 同步 信号 ) 通过 CLKX, 
CLKR, FSX # FSR 引 脚 来 实现 。CPU 或 DMA 控制 器 从 数据 接收 寄存 器 (DRR ) 读 人 数据 ， 把 
将 发 送 的 数据 写 到 数据 发 送 寄 存 器 (DXR )， 发 送 移 位 寄存 器 把 数据 移 位 到 DX 上 ， 接 收 欧 位 寄 
存 器 把 DR 上 接收 到 的 数据 复制 到 接收 缓冲 寄存 器 ， 然 后 ， 接 收 缓冲 寄存 器 上 的 数据 再 复制 到 接 
收 移 位 寄存 器 ， 进 而 被 CPU 或 DMA 控制 器 读 取 。 

其 他 寡 存 器 包括 : 串 行 口 控制 寄存 器 【SPCR )、 接 收 /发 送 控制 寄存 器 (RCR/XCR )、 接 收 / 
发 送 通道 启用 寄存 器 ( RCER/XCER ), 密码 控制 寄存 器 (PCR ) 以 及 抽样 速率 产生 寄存 器 ( SRGR ), 
这 些 寄 存 器 支持 更 多 的 数据 通信 "1。 . 


CLKX 
CLKR 时 钟 产 生 帧 
FSX 同步 产生 32 位 外 设 总 线 


CLKS 与 控制 







中 断 到 CPU 


同步 
至 DMA 的 事件 


图 3.4 McBSP 内 部 原理 图 
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3.316 直接 存储 器 存 取 方 式 


直接 存储 器 存 取 方式 (DMA ) 允许 内 存 和 外 设 之 间 直 搂 进 行 数据 传输 而 无 需 CPU 的 干预 , 4 
个 DMA 通道 可 以 独立 配置 进行 数据 传送 。 除 此 之 和 外， 还 有 一 个 附加 辅助) 的 通道 用 于 主机 端 
口 接口 (HPI) 的 DMA, DMA 可 直接 访问 片 内 存储 器 和 外 部 存储 器 接口 (EMIF )， 可 以 传输 不 
同 长 度 的 数据 ， 包 括 8 位 的 字 节 、16 位 的 半 字 和 32 位 的 字 。 

AVS DMA 寄存 器 用 于 配置 DMA 工作 方式 :地址 寄存器 ( 波 地 址 和 目的 地 址 入 索引 寄存 
器 、 计 数 重 载 寄存 器 、DMA 全 局 数据 寄存 器 和 控制 寄存 办 。 源 地 址 和 目的 地 址 可 能 来 自 内 部 程 
序 存储 器 、 内 部 数据 存储 器 、 外 部 存储 器 接口 和 内 部 的 外 设 总 线 ， 外 部 的 引 脚 以 及 内 部 外 设 所 产 
生 的 中 断 都 可 以 启动 DMA 传输 。 

每 个 DMA 通道 可 以 用 CPU 编程 具有 不 同 的 优先 级 。 在 4 个 DMA 通道 中 , 通道 0 具有 最 高 
优先 级 ， 而 通道 3 的 优先 级 最 低 。 每 个 DMA 通道 都 可 以 独立 启动 数据 块 的 传输 。 一 个 数据 块 可 
以 包含 多 个 帧 ,一 帧 可 包含 多 个 单元 ， 一 个 单元 有 一 个 独立 的 数据 。DMA 计数 重 载 寄 存 器 内 的 
数据 包含 两 部 分 : 表示 帧 数 (高 16 位 ) 的 部 分 和 表示 单元 数 { 低 16 位 ) 的 部 分 。 一 些 DDSP 有 增 
强 DMA (EDMA ) 通道 ， 有 网 达 16 个 独立 的 可 编程 通道 。 


3.17 存储 数据 需要 考虑 的 问题 


3.17.1 数据 分 配 


在 连接 命令 文件 中 ， 可 以 对 程序 代码 和 数据 自在 存 赃 器 区 域 中 位 置 进 行 分 配 。 这 些 段 可 以 事 
先 赋 给 初始 值 ， 也 可 不 赋 初 始 值 。 除 .text Bob, BLO RAR AR BT F6 BL RE NERA 
部 程序 存储 器 中 。 

PRPS BUR : 


-cinit， 定 义 全 局 静态 变量 段 。 
.const， 定 义 全 局 静态 常量 段 。 
switch， 包 含 大 型 开关 请 和 甸 的 跳 转 表 。 
-text， 定 义 可 执行 程序 代码 和 常量 眉 。 


ARDEA : 


1. .bss， 定 义 全 局 静态 变量 段 。 

2. far, 定义 远程 全 局 静态 变量 段 。 

3. .stack， 分 配 系统 堆栈 存储 器 。 

4. .sysmem, malloc, calloc, realloc 分 配 函 数 的 动态 存储 空间 。 


连接 程序 可 用 于 确定 将 不 同 段 放 在 哪些 地 方 更 为 合理 ， 例 如 ， 为 了 最 高 就 地 执行 程序 ， 可 以 
HES BOR TE ARBRE TERRES 


3.172 ”数据 存 取 格 式 


Cox 总 是 对 按 一 定 方式 排列 的 数据 进行 访问， 可 按 字 节 、 半 字 和 字 ( 32 位 ) 寻 址 。 数 据 格式 
包括 4 字 节 、 两 个 半 字 和 字 方 式 ， 如 32 位 数据 传送 语句 用 LDW， 地 址 是 按 字 对 齐 的 ， 所 以 地 址 


A La to 一 
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的 低 两 位 是 0， 否 则 就 会 发 生 数据 传送 错误 。C6x 还 能 访问 双 字 数据 (64 位 )。.S1 ALS2 两 个 功 
能 单元 都 可 用 于 执行 双 字 指令 LDDW, PETRI 64 位 双 字 数据 的 传送 ， 从 而 实现 每 时 钟 周 期 传 
送 128 位 数据 。 


3.17.3 Pragma 命令 


Pragma 命令 通知 编译 器 注意 几 个 函数 ， 这 些 命令 包括 DATA ALIGN, DATA SECTION 等 。 
DATA, ALIGN 的 pragma 命令 的 语法 是 ， 
*pragma DATA ALIGN (symbol, constant); 
该 语句 指定 symbol 的 对 齐 方式 ，constant 是 以 2 WIAA. AMAI FET 例子 中 ， 使 用 pragma 
命令 将 数据 按 一 定 方式 存放 在 存储 器 中 。 
DATA, SECTION 的 pragma 命令 的 语法 是 ， 
#pragma DATA_SECTION (symbol, "my section"); 


该 语 铝 为 Symbol Æ% X my. section 的 段 中 分 配 存 储 空间 。 
筋 一 个 有 用 的 pragma 命令 是 : 


# pragma MUST ITERATE (20,20) 
该 语句 通知 编译 器 下 面 循 环 执行 如 次 【最 大 最 小 值 都 是 20 )。 


3.17.4 geet 


在 默认 情况 下 ， 编 译 器 按 小 存储 器 模式 生成 程序 代码 ， 如 果 数 据 不 声明 为 远程 (far ) 型 ， 数 
据 都 被 默认 为 近 程 (near ) 型 。 如 果 使 用 DATA_SECTION 的 pragma 指令 ， 数 据 对 象 就 被 声明 为 
far 和 远程 变量 。 

如 何 调用 实时 运行 支持 函数 可 通过 两 种 选项 来 进行 控制 ,第 一 种 是 利用 选项 -m0 及 实时 支持 
数据 和 near 调用 进行 控制 , 第 二 种 是 利用 选项 -mrl 及 实时 支持 数据 和 far 调用 进行 控制 。 使 用 far 
方式 调用 了 沙 数 并 不 表示 这 些 责 数 一 定 驻 留 在 片 外 存储 器 中 。 

大 存储 器 模式 可 用 连接 器 选项 -mlx (x 为 0-4 的 数字 ) 来 实现 。 如 果 没 有 说 明 ， 在 默认 情况 
下 , 数据 和 函数 都 被 认为 是 near 型 。 只 有 当 调 用 的 函数 偏 秘 1 M 字 以 上 的 情况 下 ,这 时 才 会 用 大 
存 鱼 器 模式 。 


3.18 ”定点 和 浮 点 格式 
在 附录 C 中 ,我 们 回顾 了 有 关 定 点 的 一 些 问题 。 
3.18.1 数据 类 型 


数据 类 型 包括 以 下 4 种。 


1. short; 16 位 短 整 型 。 用 二 进 制 补 码 表示 时 ， 表 示范 围 为 -2185.253_1， 

2. int 或 signed int: 32 位 整 型 。 用 二 进 制 补 码 表 示 时 ， 表 示范 围 为 -23._23._1 

3. float: 32 位 浮 点 型 。 用 IEEE 32 位 表示 时 ,表示 范围 是 2775 = 1.175 494 x 1999 39] 2418 
= 3.402 823 46 x 1075, 
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4. double: 64 位 双 精 度 型 。 用 .下 EF 64 位 表示 时 ， 其 范围 是 2 02 = 2.225 073 85 x 10 75 到 
2710 = 1.797 693 13 x 10°, 


数据 类 型 对 程序 性 能 有 一 定 的 影响 ， 如 short 型 定点 乘法 比 int AM CATR), de 
用 const 同样 可 以 提高 程序 性 能 。 


3.18.2 浮 点 格式 


浮 点 处 理 器 有 较 宽 的 动态 范围 ， 定 标 是 比较 容易 的 。 如 图 3.5 Ero, SEXUS UT RI 32 位 的 单 
精度 数 或 者 用 64 位 的 双 精 度数 来 表示 。 如 图 3.5(@) 所 示 , 在 单 精度 数 表 示 格 式 中 ,位 31 表示 符号 
位 , 位 23 到 位 30 是 指数 位 , 位 0 到 位 22 是 小 数位 。 小 到 10 习 的 数 和 大 到 10 的 数 都 可 用 单 精 
度数 据 格式 来 表示 。 在 双 精 度 表 示 格 式 中 ， 如 图 3.5(bj 所 示 ， 指 煞 位 和 小 数位 有 更 多 的 位 数 。 因 为 
使 用 64 位 表示 数据 ， 所 以 需要 使 用 寄存 器 对 。 第 一 个 寄存 器 的 位 0 到 位 31 代表 小 数位 ， 第 2 个 
寄存 器 位 0 到 位 19 也 是 小 数位 ,位 20 到 位 30 是 指数 位 ， 位 31 表示 符号 位 ， 因 此 使 用 双 精 度 格 
式 可 以 表示 小 到 107 和 大 到 10" 江 的 数据 。 


3130 23 22 0 


(a) 单 精度 
3130 2019 031! 0 
| e | f | E | 
() 双 精 度 E 
”图 3.5 -数据 格式 


以 SP 和 DP 结 尾 的 指令 分 别 表 示 单 精度 和 双 精 度 指令 ,有 些 浮 点 指令 比 定点 指令 延迟 时 间 长 。 
BAM: 定点 乘法 MPY 需要 1 个 延迟 或 NOP， 而 单 精 度 MPYSP 指令 需要 3 个 延迟 ， 双 精 度 指令 
MPYDP 则 达到 9 个 延迟 。 

单 精度 浮 点 指令 ADDSP 和 MPYSP 有 3 4-RGRIIER, WE 4 个 时 钟 周期 完成 指令 的 执行 ， 
双 精 度 指 令 ADDDP 和 MPYDP 分 别 有 6 和 9 个 延迟 时 阶 。 浮 点 双 宇 传输 指令 LDDW ( 与 定点 指 
4 LDW 一 样 ， 具 有 4 个 延迟 时 隙 ) 可 传送 64 位 ， 两 个 LDDW 指令 可 通过 .S1 和 .82 并 行 执行 ， 
每 个 周期 传送 128 位 。 

一 个 单 精度 浮 点 数 可 以 存 到 一 个 寄存 器 里 ， 而 一 个 64 位 的 双 精 度 肖 点 数 需 要 存 到 寄存 器 对 
F, W ALAO, A3:A2, …, BEBO, B3:B2, …， 最 低 32 位 有 效 位 保存 到 偶数 的 寄存 器 对 中 ， 而 最 高 
32 位 有 效 位 存放 到 奇数 的 寄存 器 对 中 。 

当 使 用 浮 点 指令 时 ， 必 须 权衡 动态 范围 、 精 度 和 运行 速度 的 影响 。 


3.483 BRE 


FEA C6711 处 理 器 有 单 精度 倒数 指令 RCPSP, 除法 运算 可 以 通过 利用 分 母 的 倒数 乘 以 分 子 来 
实现 趾 。 尽 管 没有 定点 的 除法 指令 ， 但 有 些 程序 可 用 来 进行 除法 运算 ， 这 些 程序 利用 定点 处 理 器 
实现 Newton-Raphson 算法 ， 达 到 除法 运算 的 目的 。 | 
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3.9 ”程序 改进 
第 8 章 讨 论 了 几 种 程序 优化 方法 ， 包 括 使 用 定点 、 浮 点 实现 及 汇编 程序 的 优化 方法 。 


3.19.1 内 部 函数 
C 程序 可 利用 运行 库 支 持 文件 里 的 许多 内 部 函数 进行 进一步 优化 ， 内 部 隙 数 类 似 于 运行 支持 
PER. ARE HOR. WE. RAR ARSE, Hin. 合用 内 部 函数 mpy 代替 
BEAT WTAE. ARRAN, HARRIAN Cox 的 指令 中 。 例 如 ， 
int _mpy(} 


等 效 于 汇编 指令 MPY ， 它 将 两 个 数 的 最 低 16 位 相 乘 。 内 部 函数 int _mpyh() 等 效 于 汇编 指令 
MPYH， 将 两 个 数 的 最 高 16 位 相 莱 。 


3.19.2 ”循环 计数 的 trip 指令 

线性 汇编 指令 .trip 是 用 于 指定 循环 适 代 的 次 数 ， 如 果 事 先知 道 和 使 用 确定 的 次 数 ， 线 性 汇编 
优化 器 可 产生 流水 线程 序 (将 在 第 8 章 中 讨论 )， 而 不 会 产生 多 余 的 循环 ， 这 种 方法 可 同时 缩短 
程序 的 长 度 和 执行 时 间 。 妈 使 不 是 确切 的 数值 ， 例 如 当 实 际 光 代 次 数 是 某 指定 信 的 倍数 时 ，.trip 
指令 也 可 以 用 来 改进 性 能 。 内 部 函数 _nassert( ) 在 C 程序 中 可 替代 ,tp 指令 ， 例 3.1 在 点 积 的 程序 
例子 中 说 明了 .nassert( ) 的 使 用 方法 。 


3.19.3 RBZ 
数据 和 地 址 交叉 路 径 指令 用 于 提高 程序 代码 的 效率 ,指令 ， 
MPY .Mix A2,B2,A4 . 
说 明了 数据 路 径 交 灸 过 程 , 两 个 数 A2 和 B2, 分 别 来 自 A 和 B 寄存 器 组 , 相 莱 的 结果 放 在 AA H. 
如 果 结 果 存 放 在 B 寄存 器 组 中 ， 就 要 在 指令 中 使 用 x 交叉 路 径 ， 这 时 指令 变 成 ， 
MPY .MZx A2,B2,B4 
乘 的 结果 存放 在 B4 中 。 指 令 : 
LOW .D1T2 *A2,B2 


表示 一 个 地 址 交叉 路 径 ， 将 寄存 器 A2(A 组 寄存 器 ) 的 内 容 传送 到 寄存 器 B2 (B 组 寄存 器 ) 中 。 
在 Cóx "P, 只 有 两 个 可 用 的 交叉 路 径 , 所 以 在 一 个 周期 内 , 不 能 有 两 个 以 上 的 指令 使 用 交叉 路 径 。 


3.19.4 ”软件 流水 线 


软件 流水 线 就 是 使 用 可 用 的 资源 得 到 高 效 的 流水 线程 序 代码 ， 它 的 目标 是 在 一 个 循环 体内 使 
用 所 有 的 8 个 功能 单元 ， 但 是 ， 使 用 软件 流水 线 方法 需要 花 很 多 编程 时 间 。 获 得 流水 线程 序 需要 


I， 开 始 部 分 
2. 循环 内 核 (循环 体 ) 
3. SEN 
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开始 部 分 包含 建立 第 二 步 循 环 体 的 指令 ,结尾 部 分 ( 最 后 一 步 ) 包含 完成 所 有 循环 选 代 的 指 
令 。 当 优化 选择 级 划 采 用 -o2 或 -03 时 ， 编译 器 就 会 使 用 软件 流水 线 方法 。 最 有 效 的 软件 流水 线 
程序 代码 有 循环 过 程 计数 器 ， 该 计数 器 是 递减 的 ， 例 如 : 

for {i=N; i iz0;i--) 

举 一 个 点 积 的 例子 ， 有 两 个 数组 ， 每 个 数组 有 N 个 数 ， 数 的 宽度 为 32 位 ， 用 手工 编写 的 流 
水 线程 序 代码 需要 N2 + 8 个 周期 计算 两 个 数组 积 的 和 。 按 这 种 方式 计算 ， 计 算 200 个 数 的 数组 
积 的 和 ， 如 第 8 章 所 述 ， 就 需要 108 个 时 钟 周 期 。 这 种 效率 是 通过 使 用 一 些 指 令 来 实现 的 ， 如 用 
LDW 指令 传送 32 位 字 ， 用 mpy 和 mpyh 两 条 指令 分 别 实现 高 16 位 和 低 16 位 的 乘法 。 

去 掉 结尾 部 分 可 以 减 小 程序 代码 的 长 度 ， 可 用 选择 项 -msn(n = 0,1,2) 通知 编译 器 ， 优 先 考 
虑 程序 代码 长 度 的 优化 ， 然 后 再 对 性 能 进行 优化 。 为 了 手工 编写 软件 流水 线程 序 ， 先 要 夯 一 张 关 
联 关系 图 ， 同 时 建立 一 个 时 间 进 度 表 中。 在 第 8 章 中 ,我们 将 讨论 与 程序 代码 效率 有 关 的 软件 流 
水 线 方法 。 


320 ”约束 因素 


3.20.1 存储 器 约束 


内 部 存储 器 由 多 个 块 绝 成 ， 可 间 时 对 数据 进行 读 取 和 存储 。 因 为 每 个 存储 器 块 是 单 端 下 ， 因 
此 每 个 周期 只 能 访问 一 次 某 个 存储 块 。 如 果 一 个 周期 内 访问 不 同 的 奉 储 块 ， 屠 么 一 个 周期 内 可 访 
问 不 同 的 存储 块 可 达 两 次 。 如 果 多 次 访问 同样 的 存 情 块 《 在 同一 空间 内 )， 那 么 流水 线 操作 就 会 
停止 ， 从 而 导致 完成 执行 需要 附加 的 时 钟 周期 。 


3.20.2 ”交叉 路 径 约 束 
因为 两 条 数据 路 径 的 每 边 只 有 一 个 交叉 路 径 ， 所 以 每 个 周期 至 志 有 两 条 指令 使 用 交叉 路 径 。 
由 于 使 用 了 两 个 可 用 的 交叉 路 径 ， 下 面 的 程序 语句 是 有 效 的 ， 


ADD .Lix A1,B1,A0 
{| MPY .M2x A2,B2,B3 


但 下 面 的 程序 语句 就 是 无 效 的 ， 因 为 两 条 指令 使 用 同一 条 交 义 路 径 ， 


ADD .Lix Al,B1,A0 
|| MPY .Mix A2,B2,A3 


与 功能 单元 连 在 一 起 的 x dSR— PRE, 


3.20.3 ”该 取 / 存 储 约束 


使 用 的 地 址 寄存 器 必须 和 .D 单元 位 于 相同 的 数据 路 枯 、 下 面 的 程序 语句 是 有 效 的 : 
LDW .D1 *A1,A2 
|| LDW .D2 *B1,B2 
而 对面 这 两 条 语句 却 是 无 效 的 ， 


LDW .Dl *A1,A2 
|| LDW .D2 *A3,82 
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另外 ， 读 取 和 存储 不 能 是 在 同一 个 寄存 器 组 ， 如果 一 条 读 取 《〈 或 存 铺 ) 指令 使 用 一 个 寄存 器 
组 ， 另 一 条 并 行 执行 的 读 取 《或 存储 ) 指令 必须 使 用 另 一 个 寄存 器 组 。 例 如 : 
LDW .D1 *A0,B1 
[| STW .D2 A1,*B2 
下 面 这 两 条 指令 也 是 有 效 的 : 
LDW .D1 *AO,B1 
|| LDW .D2 *B2,A1 
但 是 下 面 这 两 条 并 行 执行 指令 就 是 无 效 的 ; 
LDW .D1 *A0,A1 
|| STW .D2 A2,*B2 


3.20.4 在 一 个 取 指 包 内 多 个 执行 包 对 流水 线 的 影响 


ER 3.3 中 ， 给 出 了 在 一 个 取 指 包 内 并 行 执行 的 8 条 指令 流水 线 操作 的 过 程 。 表 3.7 给 出 了 
在 一 个 取 指 包 内 ， 当 有 多 个 执行 包 时 流水 线 操作 的 过 程 。 

考虑 6 个 取 指 包 (FP1~FP6 ) 的 流水 线 操作 ，FP1 包含 三 个 执行 包 ， 其 余 每 个 取 指 包 包含 一 
个 执行 包 。 从 第 2 个 时 钟 周期 到 第 5 个 时 钟 周期 ，FP2 到 FP6 的 每 个 取 指 包 启动 各 自 的 程序 取 指 
周期 ， 当 CPU 检测 到 FP1 含有 多 个 EP 时 ， 它 强制 流水 线 暂 停工 作 ， 以 致 FP1 的 EP2 和 EP3 分 
别 在 第 6 个 和 第 7 个 时 钟 周期 启动 相应 的 分 发 过 程 。 在 一 个 FP 内 的 每 条 指令 有 一 个 p 比特 位 ， 
该 位 说 明 这 条 指令 是 否 和 后 续 的 指令 并 行 执行 ( 如果 该 位 是 1， 表 明 这 条 指令 和 后 续 指 令 是 并 行 
执行 的 ， 如 图 3.3 Bras) 。 


33.7 流水 线 的 暂停 效应 











PJENA 
1 2 3 4 5 6 7 8 9 10 11 12 
PG PS PW PR DP DC El E2 E3 E4 BS E6 
DP Dc El E2 E3 E4 ES 
DP DC El E2 E3 E4 
PG PS PW PR x x DP DC El E2 E3 
PG PS PW X X PR DP DC El E2 
PG PS x x PW PR DP Dc Ei 
PG X X PS PW PR DP DC 
X X PG PS PW PR DP 





从 第 1 个 到 第 4 个 时 钟 周期 ， 程 序 开 始 相应 的 取 指 周期 。 在 一 个 取 指 包 中 的 三 个 EP 会 导致 
流水 线 暂 停工 作 ， 这 就 使 EP2 在 第 6 个 时 钟 周期 【不 是 第 5 个 时 钟 周 期 ;、EP3 在 第 7 个 时 钟 周 
期 启动 DP 过 程 。 后面 只 有 一 个 EP (8 条 并 行 指令 ) 的 取 指 包 FP2 暂停 下 来 ， 这 样 前 一 个 取 指 包 

(FPL) 的 三 个 EP 都 通过 分 发 DP 过 程 。 因此， 尽管 FP2 在 第 二 个 时 钟 周 期 开始 取 指 ,但 它 的 分 
发 DP 过 程 需要 延迟 到 第 8 个 时 钟 周期 才能 开始 。 第 三 取 指 包 (FP3 ) 也 只 有 一 个 执行 包 , 在 第 三 
个 时 钟 周期 开始 取 指 ， 由 于 流水 线 暂停 操作 ， 它 的 DP 分 发 直到 第 9 个 时 钟 周期 才 开 始 。 

因此 , 一 个 FP 内 有 三 个 EP， 流 水 线 操作 需要 暂停 两 个 时 钟 周 期 ， 表 3.7 描述 了 流水 线 暂停 

操作 的 情况 。 表 中 流水 线 暂停 发 生 在 第 一 个 FF， 它 有 4 个 EP， 每 个 EP 有 两 个 并 行 指令 。 
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321 TMS320C64x 处 理 器 


C6000 系列 的 另 一 个 成 员 是 C64x，C64x 可 在 千 兆 赫兹 的 较 高 时 钟 速 率 下 工作 。 在 750 MHz 
时 钟 速率 下 ， 每 个 时 钟 周期 S 条 指令 ， 相 当 于 6000 MIPS ( 每 秘 6 000 000 000 条 指令 )。 

C64x 基于 VELOCITI2 结构 ， 是 VELOCITI 结构 的 扩展 四 。 它 的 一 些 特 点 包括 : 具有 大 存储 
嚣 空间， 是 多 数 存 储 器 容量 的 两 倍 ， 共 有 姥 个 32 位 的 寄存 器 。 略 外 的 寄存 器 适用 于 分 组 数据 类 
型 的 操作 ， 支 持 4 个 8 位 或 两 个 16 位 或 一 个 32 位 的 寄存 器 进行 运算 ， 因 此 增强 了 并 行 处 理 的 能 
力 。 例 如 ，MPYU4 指令 在 一 个 指令 周期 时 间 内 执行 4 个 8 位 的 雏 法 。 另 外 ， 还 添加 了 一 些 特 殊 
的 指令 ， 这 些 指令 用 于 无 线 通 信和 数字 图 像 处 理 中 遇 到 的 许多 运算 ， 在 这 些 讽 用 中 ，8 位 数据 处 
理 是 经 常 的 事情 。 除 此 之 外 ，.M 单元 〈 系 法 运算 的 功能 单元 ) 也 能 执行 移 位 和 循环 移 位 操作 。 司 
样 ，D 单元 (数据 处 理 功 能 单元 ) 也 能 执行 逻辑 运算 。 

C64x 是 定点 处 理 问 ， 现 有 的 指令 适合 于 更 多 的 单元 ， 双 字 读 取 (LDDWO 和 存储 ( STDW) 
指令 每 个 周期 可 访问 64 位 的 数据 , 还 有 两 个 双 字 读 取 和 存储 指令 ( 每 个 周期 可 访问 128 位 的 数据 D. 

C64x 处 理 器 添加 了 许多 指令 。 例 如 ， 指 令 : 


BDEC LOOP, BO 


使 计数 器 BO 递减 ， 并且 (基于 BO) 执行 到 LOOP 语句 的 条 件 分 支 。 在 计数 器 递减 之 前 进行 分 支 
条 件 判断 ， 判 断 是 根据 BO 是 不 是 负数 〈 并 不 是 判断 BO 是 否 为 0 )。 这 种 多 任务 指令 好 像 C3x 和 
C4x 系列 处 理 回 中 的 指令 。 

另外 ,利用 内 部 C BR _dotp2， 可 实现 两 个 16 x 16 位 的 积 ， 然 后 把 积 加 起 来 ， 从 而 进一步 
减 小 运算 所 需要 的 时 钟 周期 。 这 个 内 部 函数 相应 的 汇编 函数 为 DOTP2, 它 使 用 两 个 乘法 单元 ， 
每 个 时 钟 周期 可 实现 4 个 16 x 16 位 数据 的 溢 法 ， 相 当 于 C62x BR C67x 速率 的 两 倍 。 当 时 钟 速率 
是 750 MHz 人 时， 相当 于 每 秒 30 LRE, 或 者 是 每 秒 60 ZK 8 x 8 运算。 


3.22 程序 范例 


本 节 讨 论 6 个 程序 例子 ,第 一 个 是 使 用 内 部 函数 _nassert 提高 点 积 运算 效率 的 例子 ， 其 他 5 个 
例子 介绍 了 汇编 和 线性 汇编 程序 的 实现 : 一 个 用 C 程序 调用 汇编 函数 ,一 个 用 C 程序 调用 线性 汇 
编 落 数 以 及 一 个 汇编 程序 调用 汇编 函数 。 在 这 里 ,重点 是 介绍 汇编 和 线性 汇编 程序 的 语法 ， 并 不 是 要 

求生 成 优化 的 程序 。 第 8 章 将 进一步 讨论 程序 优化 方法 以 及 与 之 相关 的 程序 效率 和 软件 流水 线 方法 。 


例 3.1 高 效 点 积 程序 

本 例 介 绍 使 用 内 部 钞 数 _hassert 在 点 积 运 算 中 的 优点 ， 仍 然 使 用 第 1 章 介绍 的 点 积 运算 作为 
例子 。 图 3.6 给 出 了 程序 dotpopt.c, 它 调用 了 图 3.7 中 的 C BRE dotpfunc.c。 利 用 _nassert 调整 输 
信 数 据 指针 ， 并 和 将 它 作为 常量 指针， 该 函数 生成 了 更 高 效率 的 程序 代码 ， 同 时 这 给 编译 器 提供 了 
关于 循环 的 附加 信息 。 i 

检验 一 下 ， 如 果 编 译 器 选项 选择 -g 和 -03， 函 数 dotpfunc.c 的 执行 时 间 将 从 100 个 时 钟 周 期 
(不 用 内 部 西数 ) 降 到 71 个 时 钟 周期 (使 用 内 部 函数 ) 如 果 使 用 编译 项 选 项 选择 -g, -pm 和 -03， 
执行 时 间 进 一 步 减少 到 30 个 时 钟 周 期 。 选 项 -pm 是 进行 程序 级 优化 ， 此 时 源 文 件 先 被 编译 成 中 
间 文 件 , 为 了 比较 编译 选项 的 影响 , 可 以 把 该 结果 和 用 例 1.3 中 的 函数 dop 得 到 的 结果 进行 比较 。 
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//detpopt.¢ Optimized dot product of two arrays 


#include <stdio.h> 
#include "dotp4.h* 
#define count 4 
short x[count] = {x_array}; //declare ist array 
short y[count] = (y array): //declare 2nd array 
volatile int result = 0; //result 
main(í) 
[ 
result = dotpfuncíx.y,count); //call optimized function 


printf(*result = %d decimal An^", result); //print result 
) 





图 3.6 KARK C ERY ( dotpopt.c ) 


//dotpfunc.c Optimized dot product function 


int dotpfunc(const short *a, const short *b, int ncount) 
{ 

int sum = 0; 

int i; 


-—nassert((int)(a)&4 == 0); 


—nassert((int) (b}%4 == 0); 

—nassert {{int) (ncount)$4 == 0); 

for ( i = 0; i < ncount; i++} 

) sum += (a[i] * bri]); //sum of products 
return (sum) ; //return sum as result 





图 3.7 使 用 _nassert 内 部 函数 ， 被 C 程序 调用 求 点 积 的 函数 ( dotpfunc.c ) 


在 第 8 章 中 , 我 们 对 两 个 数组 的 点 积 程序 进行 优化 ,其 中 每 个 数组 有 NN 个 数 。 我 们 得 到 这 样 的 
结果 : 利用 定点 实现 ， 执行 时 间 将 减少 到 7+ NI2+ 1 时钟 周 期 。 或 者 说 ， 当 每 个 数组 有 200 个 数据 
时 , 执行 时 间 就 是 108 个 时 钟 周 期 ; 而 利用 浮 点 实现 时 ,执行 时 间 就 是 124 个 时 钟 周 期 ( 见 表 8.4 )。 

例 3.2 AIC WAC. oE n (n-1)(n-2) 1 的 值 

该 例 说 明了 如 何 利 用 C 程序 调用 汇编 函数 。C 源 程序 sume (如 图 3.8 所 示 ) 调用 汇编 函数 
sumfunc.asm ( 如 图 3.9 所 示 )， 该 程序 实现 求 e+ (n- 1) * (n 2) 189(8. FEC 主 程序 中 设置 
nfl, (BERL) 该 值 传 递 给 寄存 器 A4， 例如， 多 个 数 的 地 址 可 由 寄存 器 A4, B4, AG, .… 传 递 到 
污 编 函 数 ， 汇 编 函 数 得 到 的 求 和 结果 返回 给 C 程序 的 result 变量 ， 然 后 答 出 最 后 结果 。 

汇编 函数 的 命名 《 按 常规 ) 通常 以 下 划 线 开始 。 在 函数 asm 中 ， 寄 存 器 A4 里 存放 的 数 nie 
送 到 Al 寄存 器， 并 将 AT 寄存 器 设 为 循环 计数 器 ，Al 随 着 程序 执行 递减 。 程 序 代码 的 循环 部 分 
从 标号 或 地 址 LOOP 开始 ， 在 第 一 个 分 支 语 句 B 结束 。 第 一 次 加 法 运算 计算 出 hn + (n - 二 的 
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(A, 结果 放 在 A4 P, Al 寄存 器 的 值 再 递 碱 到 (n - 2) 。 分 支 语句 是 基于 Al 寄存 器 值 的 条 件 转移 
语句 (只 有 AI, A2, BO, BI, B2 可 用 做 条 件 寄存 器 ) AW AL 不 为 0 时， 循环 分 支 语句 返回 
到 LOOP 标号 处 ,继续 执 行 循环 内 的 措 令 ， 这 样 寄 存 器 的 值 A4=n+ tn 一 1) BOE 
Al = (n - 2) ， 循 环 一 直 执行 到 Al = 0 时 结束 。 


//Sum.c Finds n+(n-1)+...+1. Calls assembly function sumfunc.asm 





#include <stdio.h> 


main {} 

í 

short n=6; //set value 

short result; //result from asm function 
result = sumfunc(n); //cali assembly function sumfunc 


printf(*sum = $d”, result); //print result from asm function 
} 





图 3.8 ”调用 汇编 程序 求 # + (rn — 1) + (n - 2) +--+ 189 CBF (sume?) 
#Bumfunc.aam Assembly function to find nt{n-1)4+...4+1 
.def _sumfunc ;function called from C 


.sumfunc: MV :Li  A4,A1 ;Betup n as loop counter 
SUB .S1 Al1,1,A1  ;decrement n 


LOOP: ADD .L1 A4,A1,A4 ;accumulate in A4 
SUB .Si A1,1,A1  ;decrement loop counter 
[A1] B .82 LOOP ;branch to LOOP if A150 
NOP 5 :five NOPs for delay slots 
B .82 B3 ;return to calling routine 
NOP 5 ifive NOPs for delay slots 
.end 





图 3.9 工程 sum 中 ， 被 C 程序 调用 的 汇编 函数 ( sumfunc.asm ) 


“第 二 个 分 支 指令 ( 按 常规 ) 是 C 调用 程序 的 返回 地 址 B3， 最 后 的 求 和 结果 或 累加 的 值 保存 

到 A4 中 ， 最 终 传 送 给 C 程序 的 result 变量 ，5 个 NOP 指令 (SHEE) 占用 5 ASSES IN DR, 加 入 
这 5 个 延迟 时 隔 表 示 分 支 指令 的 延迟 。 

程序 中 选择 了 .S ALL 功能 单元 ， 员 然 不 是 必需 的 ， 但 这 样 做 是 有 用 的 ， 有 利于 调试 和 分 析 哪 
些 功 能 单元 能 提高 程序 效率 。 同 样 ， 标 导 LOOP 后 的 两 个 崩 号 和 函数 也 不 是 必需 的 。 

建立 和 运行 名 为 sum 的 工程 ， 将 C 程序 中 = 设 为 56， 检验 求 和 的 结果 及 打印 的 值 是 否 为 21。 

例 3.3 Ri C FESPEHMFEGL HS EE — 1 RS Pr E 

该 例 是 求 n <7 HARRE n! = n(n - 1)(n -2).…(1) ， 并 进一步 说 明 汇 编程 序 的 语法 。 与 
例 3.2 很 相似 , C 语言 源 程 序 factorial.c 如 图 3.10 所 示 ， 在 该 程序 中 设 定 n 的 值 , 它 调用 如 图 3.11 
BRA BIC BPR factfunc.asm。 注 大 部 分 对 理解 程序 是 有 帮助 的 。 

寄存 器 Al 仍 然 设 为 插 环 计数 器 ,在 从 标号 LOGP 开 始 的 循环 内 ,第 一 个 笑 法 运算 是 n(n - 1), 
并 在 A4 HRO LAPEER A4, n 的 初始 值 被 传送 给 汇编 函数 factfunc.asm. MPY 38-5-iGR — 
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个 时 除 ， 因 此 在 其 后 面 加 一 个 NOP 指令 ， 循 环 程序 一 直 执行 到 Ai = 0 时 结束 。 注 意 : 在 该 程序 
中 没有 指定 功能 单元 ， 最 后 阶乘 的 结果 通过 A4 返回 到 C PET. 

建立 和 运行 名 为 factorial 的 工程 ， 检 验 factorial 变量 的 结果 和 输出 的 值 5040 (71 )。 注 意 ; n 
的 最 太 值 是 7， 因 为 8! 大 于 2", 


/fFactorial.c Finds factorial of n. Calis function factfunc.asm 





#include <stdio.h> //tor print statement 


void maini) 
1 


short n=7; //set value 

Short result; //result from asm function 
result = factfunc(n); //call assembly function factfunc 
printf(*factorial = td’, result); //print result from asm function 


) 





Bi 3.10 JAC BOR — “METRY CRI. (factoriale) -— 


jFactfunc.asm Assembly function called From C to find factorial 


.def _factfunc rasm function called from C 
.factfunc: MV A4,A1 ;setup loop count in A1 
SUB A1,1,A1 ;decrement loop count 
LOOP: MPY A4,A1,A4 ;accumulate in A4 
NOP :for 1 delay slot with MPY 
SUR Al1,1,A1 decrement for next multiply 
[A1] B LOOP ;branch to LOOP if Al # 0 
NOP 5 ;five NOPs for delay slots 
B B3 ;return to calling routine 
NOP 5 ifive NOPs for delay slots 
end 





图 3.11 Hi C BIFDGR— 1 ARRAS ME BRE. ( factfunc.asm ) 


例 3.4 使 用 汇编 程序 调用 汇编 函数 求 数组 的 点 积 

该 例 求 两 个 数组 的 点 积 ， 每 个 数组 有 4 个 数字 ， 参 见 例 1.3， 该 例 只 使 用 了 C 语言 程序 ， 而 
例 3.2 和 例 3.3 则 介绍 了 汇编 程序 语法 。 图 3.12 是 dotp4a_initasm 汇编 程序 清单 ， 该 程序 用 于 初 
始 化 两 个 数组 ， 并 调用 求 丙 个 数组 点 积 的 汇编 函数 dotp4afunc.asm ( 如 图 3.13 所 示 )， 同 时 该 程序 
也 通过 寄存 器 B3 设置 返回 地 址 并 将 结果 地 址 送 给 寄存 器 A0。 两 个 数组 的 地 址 和 数组 的 维 数 分 别 
通过 寄存 器 A4、A6 和 B4 传送 给 汇编 程序 dotp4afunc.asm, 被 调 函 数 的 结果 通过 A4 返回 ， 点 积 
最 后 的 结果 存 到 地 址 为 result, addr 的 存储 器 中 。 指 令 STW 将 保存 在 AA 中 的 点 积 结果 传送 到 AO 
做 指针 的 存储 器 ， 这 里 寄存 器 AO 作为 地 址 result_addr 的 地 址 指针 。 

调用 汇编 程序 的 起 始 地 址 定义 为 iit， 矢 量 文件 vectors_dotp4a.asm ( 如 图 3.14 所 示 ) 定义 了 
指向 那个 人 口 地 址 的 分 支 语 句 ， 被 调 汇编 函数 dotp4afunc.asm 计算 积 的 和 。 因 为 寄存 器 A6 不 能 
作为 条 件 寄 存 器 ( 只 有 AL, A2, BO, Bl 和 B2 可 作为 条 件 寄存 器 ),， 循环 计数 值 赋 给 寄存 器 Al。 
两 个 LDH 指令 (16 位 半 字 ) 分 别 把 两 个 数组 的 地 址 x_addr 和 y_addr 赋 纵 寄存 器 A2 和 B2。 例 
如 ， 指 令 : 
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jDotpéáa init.aasm ASM program to init variables. Calls dotp4afunc.asm | 


.def init starting address 
ref dotp4afunc ;called ASM function 
text ¡section for code 

x addr .8hort 1,2,3,4 numbers in x array 

y_addr . short 0,2,4,6 ;numbers in y array 

result addr .short 0 initialize sum of products 

init MVK result, addr,A4 ;A4 = lower 16-bit addr --»A4 
MVKH result, addr,A4 744 = higher 16-bit addr--»A4 
MVK 0,A3 ;SA3 = 0 
STH AI, *A4 rinit result to 0 : 
MVK X Aaddr,A4 7A4 = 16 MSBs address of x 
MVK y. addr,B4 7B4 = 16 LSBs address of y 
MVKH y_addr,Bd #B4 = 16 MSBs address of y 
MVK 4,A6 7A6 = size of array 
B dotp4afunc ;branch to function dotp4afunc 
MVK = ret, addr,b3 ;B3 - return addr from dotpda 
MVKH ret addr,h3 |: 7B3 = return addr from dotp4a 
NOP 3 :3 more delay slots {branch) 

ret addr MVK result_addr,Ag 730 = 16 LSBs result addr 
MVEH result addr,AO 7;A0 = 16 MSBs result, addr 
STW .— A4,*A0 štore result 

wait B ' wait jwait here 
NOP 5 ¿delay slots for branch 


图 3.12. AFR A RY AE PRÉC TE REPE. ( dotp4a_init.asm ) 


pyDotp4afunc.asm Multipiy two arrays. Called from dotpáa init.asm 
;Ad=x address,Bá-y address,Aé=count(size of array),B3=return address 


.def dotpáafunc ;dot product function 
.text Stext. section 

dotpdafunc MY A6,A1 imove loop count -->Al 
ZERO AT rinit A7^for accumulation 

loop LDH *Ad++, A2 PAZ-(x. Ad. as address pointer 
LDH *B44*,B2 ;B2-(y). B4 as address pointer 
NOP : 4c 74 delay slots for LDH 
MPY A2,B2,A3 PAS mox *oy 
NOP | . . 41 delay siot for MPY 
ADD A3,A7,A7 :Sum of products in A7 
SUB Al,1;A1 decrement loop counter 

[A1] B loop :branch back to loop till Al1«0 

NOP 5 . 75 delay slots for branch 
MV A7,A4 ;Ad=result A4-return register 
B B3 :return from func to addr in Bài 
NOP 5 . 35 delay slots for branch : 


图 3.13 Hu BRE UR OR AR AIL SAK C dotp4afunc.asm ) 
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LDH *B4++,B2 


JE B4 { 第 二 个 数组 的 地 址 ) 所 指定 的 存储 器 【第 二 个 数组 中 的 第 一 个 数 的 地 址 是 y address) 中 
HAREA B2， 然 后 指针 寄存 器 B4 指向 下 一 个 高 地 址 ， 即 第 二 个 数组 中 的 第 二 个 数 。 寄 存 器 
A7 用 于 累加 和 传送 积 的 和 到 寄存 器 A4， 因 为 最 终结 果 要 通过 AA 传 给 调用 函数 。 

该 工程 的 支持 文件 有 ( 不 需要 库 函 数 ): 

i. dotp4a init.asm 

2. dotp4afunc.asm 

3. vectors dotpáa.asm 





jvectors dotpéa.asm Vector file for dotp4a project 


.ref init ;starting addr in init file 
.Sect "vectors" ;in section vectors 
rst: mvkl .s2 init,bO0 sinit addr 16 LSB ——-B0 . 
mvkh .s2 init,bd ;init addr 16 MSB ——-BO 
b bo ;branch to addr init 
nop 
nop 
nop 
nop 
nop 








图 3.14 求 点 积 的 矢量 文件 , 在 该 文件 中 指定 在 调用 汇编 程序 中 的 入 口 地 址 ( vectors. dotpáa.asm ) 


建立 并 运行 名 为 dotp4a 的 工程 ， 修 改 连 接 选 项 { 在 Project 一 Options WHE ), W “No 
Autoinitialization”， 和 否则 在 建立 工程 时 ， 会 出 现 “entry point symbol _c_int00 undefined" 警告 ( 该 
警告 可 忽略 )， 这 是 因为 在 该 工程 中 ， 设 有 C 程序 主 函 数 ， 朵 此 没有 通常 程序 运行 的 起 始点 。 
在 程序 dotp4a_init.asm 的 第 一 个 分 支 指令 处 设置 断 点 : 


B dotpéafunc 


选择 菜单 View Memory, WEA 16 位 有 符号 整 型 数 ， 设 置地 址 为 result_addr。 在 Memory 窗 
口 向 右 点 击 ， 并 取消 选择 “Float in Main Window”， 这 样 ， 当 查看 源 文件 dotp4a_initasm 时 ， 能 
更 好 地 观察 存 情 器 窗口 。 

选择 菜单 Run， 在 断 点 处 程序 停止 执行 ， 地 址 为 result addr 的 存储 器 中 的 内 容 为 0 (被 调 
用 函数 dotpdafunc.asm 尚未 执行 )。 再 继续 运行 ,然后 停 下 来 ( 因为 程序 执行 在 无 限 等 待 循环 指 
SA): 

wait B wait ;wait here 

检验 当前 积 的 和 是 否 为 40。 注 意 ; 寄存 器 AO AA EAR d (result addr), EAH 


选择 View—CPU Registers—Core Registers ， 检 验 该 地 址 (十 六 进 制 格式 六 图 3.15 给 出 该 工程 的 
CCS 显示 窗口 ， 从 反 汇 编 文 件 中 ， 可 看 出 程序 停止 在 无 限 等 待 循环 语句 中 。 


例 3.5 TERI C 函数 调用 线性 汇编 函数 求 点 积 
图 3.16 给 出 了 CC 程序 dotp4clasm.c， 它 调用 线性 汇编 函数 dotp4clasmfunc.sa ( 如 图 3.17 所 示 D, 
例 1.3 介 绍 了 只 用 CC 语言 程序 实现 点 积 运算 ， 前面 三 个 例子 介绍 了 汇编 程序 的 语法 。 
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init asm ASM program to in result_addr 
00000230 0 
det init 00000234 
ret dot p4afunc 00000234 
text 0000023A 
GJ OSP/BIOS Contig short 12.3.4 00000240 
SD Genesated Filer short ? 2.4.6 00000246 


hort 0000024C 
GB incide pi 00000252 
C3 Lovanes MVK result_addr A4 00000258 
= G Souce 4 result, addr. 0000025E 
(E) dotpss_ink asm 00000264 
a rt qun 00000264 

|S} vectors_dotp4a asm 


— 
dot p4afunc 0000004 
MVK ret addr.b3 00000018 
NVKH ret addr.b3 * 00000028 
NOP 3 E9SFE000 
6 . 000028 
HVK result addr.AÜ 00000028 
MVKH result addr 8DFCFCBA 
STV A4.#A0 2F6FC303 B 
B vait 00000000 B10 
NOP 5 000025D4 Bil * 
SE78F7FD B12 H 





图 3.15 工程 dotp4a 中 求 点 积 的 CCS 窗口 


线性 汇编 优化 器 优化 的 程序 部 分 分 别 用 线性 汇编 器 命令 .cproc 和 .endproc 表示 线性 汇编 开始 
和 结束 。 因 为 调用 函数 在 C 程序 中 ， 被 调用 的 线性 汇编 函数 名 前 要 用 下 划 线 ， 汇 编 命令 .ref(.def) 
指定 参考 (定义 ) 函数 。 


//Dotpáclasm.c Multiplies two arrays using C calling linear ASM func 


short dotp4clasmfunc(short *a,short *b, short ncount) ; //prototype 


#include <stdio.h> ~ //for printing statement 
#include "dotp4.h" //arrays of data values 
#define count 4 //number of data values 
short x[count] = (x array); //declare 1st array 
short y[count] = {y_array}; //declare 2nd array 
volatile int result - 0; //result 
main() 
( 

result = dotp4clasmfunc(x,y,count) ; //call linear ASM func 


printf("result = $d decimal n^", result); //print result 
) 


一 


图 3.16 调用 线性 汇编 函数 求 点 积 的 C 程序 ( dotp4clasm.c ) 


在 汇编 程序 中 ， 功 能 单元 是 可 选 的 ， AFR a, b, prod 和 sum 由 线性 汇编 命令 .reg 定义， 两 
个 数组 的 地 址 x, y 和 数组 的 维 数 通 过 寄存 器 ap, bp 和 count 传送 给 线性 汇编 函数 。 和 在 C 程序 
中 一 样 ， 寄存器 ap 和 bp 用 做 指针 ， 语句 的 指令 部 分 看 上 去 像 汇编 程序 代码 ,但 后 面部 分 和 C 语 
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言 编程 语法 一 样 。 例 如 ， 指 令 ; 
loop: ldh *apt++, a 
(第 一 次 通过 程序 的 循环 部 分 ) 把 寄存 器 ap AARIATE, FRAP SKA 


寄存 器 a 中 , 然后 指针 寄存 器 ap 递增 ,指向 下 一 个 较 高 存储 器 地 址 ， 即 指向 数组 x 中 第 二 个 数 的 
存 情 单 元 的 地 址 ， 积 的 和 在 sum 中 架 加 ， 再 返回 给 调用 心 程序 。 


1Dotpáiclasmfunc.sa Linear assembly function to multiply two arrays 


.ref _dotp4clasmfunc ;ASM func called from C 
.dotpáclasmfunc: .cproc  ap,bp,count ;sStart section linear asm 
.reg a, D, prod, sum asw optimizer directive 
zero sum finit sum of products 
loop: ldh *aptt,a ;pointer to lst array-»a 
ldh "bp, b :pointer to 2nd array->b 
mpy a,b, prod iproductz a*b 
add prod, sum, sum ;Sum of products--»sum 
sub count,l,count ;decrement counter 
[count] b . loop ;loop back if count 4 0 
.return sum treturn sum as result 
.andproc rend linear asm function 





图 3.17 由 己 程 序 调用 求 点 积 的 线性 汇编 函数 ( dotp4clasmfunc.sa ) 


建立 并 运行 工程 dotp4clasm， 检 验 下 面 的 输出 结果 ; result = 40。 如 果 有 兴趣 的 话 ， 可 以 观察 
一 下 线性 汇编 函数 ， 比 较 一 下 它 和 例 1.3 中 C 程序 的 执行 时 间 差 别 。 


例 3.6 用 C 程 序 调 用 线性 汇编 函数 求 阶乘 

图 3.18 给 出 了 C 程序 factclasm.c， 它 调用 了 线性 汇编 函数 factclasmfunc.sa( 如 图 3.19 所 示 ), 
用 于 计算 小 于 8 HAKR. ETEA N 3.3， 它 利用 C 程序 调用 汇编 函数 来 计算 数 的 阶乘 。 
例 3.5 利用 C 程序 调用 线性 汇编 函数 来 计算 积 的 和 , 它 对 该 例 有 参考 意义 。 例 33 和 例 3.5 包括 了 
该 例 必 要 的 背景 知识 。 

该 工程 的 支持 文件 有 :factclasm.e，factclasmfunc.sa，vectors rts6701.lib 和 C6xdsk.cmd, EE 
立 并 运行 工程 factclasm， 检 验 7! 的 输出 结果 ， 也 就 是 检查 结果 是 否 是 factorial = 5040。 





//Factclasm.c Factorial of number. Calls linear ASM function 


#include <stdio.h> //for print statement 


void maini) 


t 


short number = 7; //set value 

short result; /fresult of factorial 

result = factclasmfunc (number); //call ASM function factlasmfunc 
printf("factorial = $d*, result); //print from linear ASM function 


) 





3.18 VFA HEIL RE PRICE BERE BS C 程序 ( factclasm.c ) 
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;jFactclagmfunc.sa Linear ASM function called from C to find factorial 


-ref _factclasmfunc ;Linear ASM func called from C 
.factciasmfunc: .cproc number start of linear ASM function 
.reg a,h rasm optimizer directive 
mv number, b pset-up loop count in b 
my number, a imove number to a 
sub b,i,b decrement loop counter - 
loap: mpy a,b,a in(n-1} 
sub b,l1,b decrement loop counter 
[5] b loop loop back to loop if count # 
.return a ;result to calling function 
-endproc tend of linear asm function 


图 3.19 被 C 程 序 调 用 求 阶 乘 的 线性 汇编 函数 【 factclasmfunc.sa ) 
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第 4 章 A eR for TSE aS 


本 章 介 绍 了 和 离散 时 间 信 和 号 联系 在 一 起 的 z 变换 , PT TR) s FT Bz BB 
换 的 zx 平面 ， 同 时 还 介绍 了 用 傅 里 叶 级 数 方法 ， 设 计 FIR 滤波 器 以 及 编写 离散 卷 积 方程 程序 来 实 
JE FIR BSE, marhe T ARYO FIR 滤波 器 特性 的 影响 。 本 章 需 要 掌握 的 内 容 包括 z 变换 、 
有 限 冲 激 响应 《FIR ) 滤波 髓 的 设计 与 实现 及 C 语言 和 TMS320C6x 汇编 程序 实例 。 


41 z 变换 基础 


与 拉 普 拉 斯 变换 用 于 连续 时 间 信 号 分 析 相 类 似 ，z 变换 用 于 分 析 离 散 时 间 信 和 号。 我 们 可 以 用 
拉 普 拉 斯 变 搁 来 求解 表示 模拟 滤波 器 的 微分 方程 ， 或 者 用 z 变换 来 求解 表示 数字 滤波 器 的 差分 方 
程 。 考 察 一 个 模拟 信号 xD ， 当 它 被 理想 抽样 后 变 为 六 的 : 


x)= Y x()8(t- T) (4.1) 


这 里 Bt — KT) ARR WAT RE RR, T= 11F 为 抽样 周期 。 函 数 x, 人 除了 在 := KT IN 
刻 的 值 不 为 0 外 ,其余 时 刻 的 值 都 为 0。 zx 人 0 的 拉 普 拉 斯 变换 为 ; 
X,(s) =| x. (t)e-"dt 
= fj DSA +x (8G — T) + Je7tdt (42) 
RER EE PE IR 
[; (086 - kT)at = fT) 
X (A2) PRIX (S) TAS 


X.(5) = x(0) + TJET +AT eT t= V x(nT)e "t (43) 
FA (43) 中 z=e7 ， 则 式 (43) 可 写 为 ; B 
X(z)- Žare” (44) 
HER TBARS, Hbx(nT)R Eg), RRR (44) 可 写 为 : 
X(z) "Xn = ZT {x(n)} (4.5) 


XX (4.5) zenx(n)Boz SEER(ZT), x(n) 3 X()E——Ó I, A z 变换 是 一 种 独特 的 变换 。 


练习 4.1 cR HER Ex (n) = e" 89 z 变换 
Zinz0, Hk, WRB x(n) = e" Bg z 变换 为 ; 
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x(2)= Yeu - Leo’ (46) 
由 泰勒 级 数 近 似 得 到 的 几何 级 数 ， l 
Ye LL 网 <1 
式 (4.6) ER: 


fele*zt«12id»le*, k=O, x(n) = 的 :变换 是 于 (可 = z/(z - 1), 


练习 4.2 求 正弦 序列 x(n) = sinnoT B5 z 变换 
正弦 函数 可 用 复 指数 形式 表示 ， 由 欧 拉 公式 er = cosutjsinu, AB: 
. ene 一 pcinoT 
sinnoT = —EH 
则 : — 
X= Leme eT gon (48) 


利用 练习 4.1 PAJLA, ALOR X(z). 或 直接 利用 式 〈4.7 ) 的 结果 ， 将 式 (4.8) 的 第 一 
项 求 和 式 中 用 k=jwT， 第 二 项 求 和 式 中 用 k= -jao7 代 人， 可 得 : 


1 z? ~ ze tT — z? 4 ze eT 


STREET) (4.9) 
_ zsinor 
~ g -2zcosoT +1 
Cz 
= 一 一 一 1 (4.10) 
zap M 


这 里 4 = 2coswT B = -1,C = sinoT., 在 第 5 章 中 , 我 们 基于 该 结果 产生 了 一 个 正弦 依 导 , 通过 
改变 式 (4.9) 中 的 m 值 ， 我 们 可 以 很 容易 产生 不 阐 频 率 的 正 歼 波形 。 

同样 道理 ， 利 用 欧 拉 公式 将 cosnw 了 表示 成 两 个 复 指 数 的 和 ,就 可 以 得 出 x(n) = cosnoT = 
(en + en72 的 z 变 换 ， 即 : 


A= 


4.1.1 s 平面 到 z 平面 的 映射 


拉 普 拉 斯 变换 可 以 用 来 判断 一 个 系统 的 稳定 性 。 如 果 一 个 系统 的 极点 在 * 平面 上 都 位 于 虚 轴 
的 左 侧 ， 该 系统 响应 是 随时 间 误 减 的 稳定 的 系统 ; 如 果 极 点 位 于 虚 轴 的 右 侧 ， 其 系统 响应 随时 间 
增 大 ， 所 以 该 系统 是 不 稳定 的 ; RRB, BRA ORM, SME spay 
ASH ORAM, w = 0 表示 为 直流 。 


z! -zcosa@T 


44 
z;-2zcosmT +1 doi | (4.11) 
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同样 ， 我 们 可 以 根据 系统 经 过 z 变换 后 ， 其 极点 在 z 平面 上 的 位 置 来 判断 该 系统 的 稳定 性 , 
因为 我 们 可 以 找到 "平面 与 z 闻 面 相对 应 区 域 。 由 于 z = eTWRs=c+jo, WA: 
zee em (4.12) 
因此 ，z 的 幅度 为 lz| = ee ， 相 位 为 8 = OT = 2nfF,, HPP ARR. OU s 平面 到 z 平 
面 的 映射， 参见 图 4.1 所 示 区 域 的 对 应 关系 。 


4] 





41 Hs ze z BS 


a<0 

极点 位 于 * FARHAN BUPA 4.1 中 区 域 2 ) 的 系统 是 稳定 的 系统 , Be <1, 式 ( 4.12) 
产生 的 幅度 lz| < 1。 随 着 5 从 一 。 变 到 站 ，|z| 从 0 变 到 1-， 因 此， 极点 在 :平面 区 域 2 单位 圆 内 的 系 
统 是 稳定 系统 。 对 于 这 样 的 系统 ， 如 果 极 点 是 实数 ， 则 其 响应 为 指数 衰减 的 ， 如 果 极 点 为 复数 ， 
MASAE, 


o0 

BT s FHEA (ME 4.1 中 区 域 3 ) 的 系统 是 不 稳定 系统 ,因为 er7 > 1, $ (412) 
产生 的 幅度 lz| 1. MRSA, MUE, ilk, 极点 在 z 平 面 区 域 3 单位 加 外 的 系统 
是 不 稳定 系统 。 对 于 这 样 的 系统 ， 如 果 极 点 是 实数 ， 则 其 响应 为 指数 增加 的 ; 如 时 极点 为 复数 ， 
则 响应 为 幅度 逐步 增 大 的 正 汞 信 生 。 


好 = 人 

EAT s PARE (A 4.1 中 区 域 1 ) 的 系统 是 临界 稳定 系统 ， 式 (4.12 ) 产生 的 幅度 
lzl= 1. 对 应 区 域 1( 单 位 图 ), 因此 , 极点 在 :平面 的 单位 贺 上 会 使 系统 产生 正弦 振荡 。 第 5 章 中 ， 
我 们 通过 编程 使 差分 方程 的 极点 在 单位 贺 上 来 实现 正弦 信号。 注意 : 练习 42 中 , 式 (49) 中 
X(s) = sinn@ 了 的 极点 或 式 (4.11) 中 XX(5) = cosnoT HAR Ez? -2zcoso T + 1 的 根 ， 即 : 


n 2cosoT t 4cos? oT —4 


E 
2 
=cosoT +V-sin’? aT =coswT + j sinwT (443) 
每 个 极点 的 模 为 ， 
Ip o [pil 2 cos? eT 4 sin? oT =1 (4.14) 


z 的 相位 为 8 = wT = 2nf7F,， 当 频率 f 从 0 变 到 + FJ2, EMA 0 变 到 r。 
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412 ”差分 方程 


就 像 模拟 滤波 吴 可 以 用 微分 方程 来 表示 一 样 ， 数 字 滤波 器 可 用 差分 方程 来 表示 。 为 了 求解 差 
分 方程 ， 我 们 要 找到 形 如 x(n - ORR BH, x(n - 罗 对 应 于 模 氢 信 号 x( 间 的 阶 导数 
d x(tydrt， 差 分 方程 的 阶 数 由 上 的 最 大 值 决定 , 例如 = 2 表示 二 阶 差分 方程 。 由 式 (4.5) 可 得 ; 


X(z)= Tne” =x(0)+ x(Dz - x22? +--+- (4.15) 
n=l 
对 应 于 一 阶 导 数 dx/dt， 可 得 x{n - 1) 的 z 变换 为 . 


ZT[x(n-D]- Dn 027 
i na) 


= x(-1)* x(0)27 + x(D27 + x(2)2? +... 

= x(-1)4 z [x(0) + x(1)2 + x(2)z7 +--+] 

= x(-1)+ z EX (z) ( 4.16 ) 
上 式 中 使 用 式 (4.15 )，x(~1) 表 示 一 阶 差分 方程 的 初始 条 件 。 类 似 地 ， 相 应 于 二 阶 导数 Px dP, 
x(n 一 2) 的 z ERA: 


ZTIx(n—2)]|= > x(n-2)z" 


n=O 
= x{-2)+ x(-1)z7)  x(0)z7 + x(1)z? +- 
= x(—2)+ x(-1)2 + 2? [x(0) + x(1)27 +} 
zx(-2)4 XUz +z7X(2) (4.17) 


x(-2) 与 x(-1) 表 示 求解 二 阶 差分 方程 所 需 的 两 个 初始 条 件 。 一 般 地 : 
ZT|x(n -k))- z* Y scm)" * z* X(z) _ (4,18) 


ROR PRA 0, Bix(-m)-0, m-21,2,.,k, IRI (4.18) 可 简化 为 ; 
ZT [x(n— ky] = z*X(2 e. | (4.19) 


42 离散 信号 


离散 信号 可 表示 为 ，; 
x(n) = x x(m)6(n — m) | (420) 


这 里 5(r — mm) 表示 延迟 为 六 的 冲 激 序列 , Min = mit, ESF 1, 否则 等 于 0。 EHE), x(2), -- 
的 序列 组 成 ，n 表示 时 间 ， PEPE REL BLUR TAP COR hr dr TIR 
或 抽样 周期 7 = FRE, 

本 书 中 所 讨论 的 信号 与 系统 都 有 线性 时 不 变 的 ， ADA ERE RE A, Bee Ate 
为 x(n)， 输 出 响应 为 y(n)， 即 x00) o yin), W Fanin) > ayin), ax) — amyr{n), hj 
axi) + ax(n) > ayi(n) + ayn), Kia, af KR, XXELRURENVREEE, BD ASA BIRD EA 
响应 之 和 。 时 移 不 变性 是 指 如 果 输 入 延迟 m “MAREE TE], 输出 响应 同 料 会 延迟 m 个 抽样 时 间 。 即 
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x(n- m) 2 y(n — 9), 如 果 输 入 为 单位 冲 汶 8(n), 那 么 输出 响应 就 是 A(n), 也 就 是 5(n) 一 hin), h(n) 
被 认为 是 系统 的 冲 激 响 应 。 根 据 时 移 不 变 特 性 ， 延 迟 的 冲 激 输入 am — m)? E SEE D 891 E RE R7 
hin- m). 

WE. MRR Sx), Wal) — m) Ax(mM(n - m), Sig, (420), 
该 响应 变 为 : 


y(n) = Y, xmam- 风 (421) 
即 y(n) 为 <(n) 与 h(n) 的 卷 积 。 对 于 一 个 因果 系统 ， 式 (421 ) 变 为 
ym) = x x(m)h(n - m) (422) 
SA (4.22) rPk-2n- m, Exp 


yn) = S xn -k) (4.23) 
k=l 


4.3. 有 限 冲 激 响 应 滤波 器 


滤波 是 最 常用 的 信号 处 理 方 式 之 一 " 人， 现在 可 用 数字 信和 号 处 理 器 实现 实时 数字 滤波 处 理 ， 
TMS320C6x 的 指令 系统 和 结构 使 它们 非常 适合 这 种 滤波 运算 。 模 拟 滤波 器 对 连续 信 生 进 行 处 理 ， 
一 般 利用 诸如 放大 器 、 电 阻 和 电容 等 分 立 元 器 件 来 实现 ; 而 数字 滤波 器 ( 如 FIR 滤波 器 ) 对 离散 
上 时间 信号 进行 处 理 , 可 用 如 TMS320C6x 这 样 的 数字 信息 处 理 芯片 来 实现 。 这 种 过 程 涉及 到 用 ADC 
采集 外 部 输入 信号 ， 处 理 输 入 抽样 值 ， 然 后 将 最 后 的 结果 通过 DAC 输出 。 

最 近 几 年 里 ， 数 字 信 号 处 理 磊 的 成 本 显著 降低 ， 这 样 使 数字 滤波 器 比 对 应 的 模拟 滤波 器 有 了 
更 多 的 优点 ， 其 中 包括 可 靠 性 高 、 精 度 高 、 对 温度 和 老化 不 敏感 等 。 使 用 数字 滤波 带 可 实现 严格 
的 幅度 和 相位 特性 。 滤 波 器 的 各 种 特 人 性， 如 中 心 频率 、 带 宽 和 滤波 器 类 型 可 以 方便 地 调整 。 利 用 
TMS320C6x 的 DSK 和 许多 设计 和 实现 工具 ， 在 几 分 钟 内 就 可 以 实现 实时 FIR 滤波 器 。 涉 波 器 的 
设计 就 是 利用 一 组 系数 去 通 近 系统 的 传输 函数 。 

可 用 多 种 不 同 的 技术 来 设计 FIR 滤波 器 ， 如 在 4.4 节 中 讨论 的 利用 传 里 时 级 数 的 方法 ， 它 是 
一 种 常用 的 方法 。 计 算 机 辅助 设计 技术 ， 如 Parks 和 McClellan 的 设计 技术 ， 也 可 用 于 FIR 滤波 
AEH, 

式 (4.23) 的 卷 积 方程 对 设计 FIR BRU ETE A, 因为 我 们 可 以 用 有 限 项 去 逼近 它 ， Bp. 


y(n) = Y Min- k) (4.24) 


如 果 输 入 为 单位 冲 激 x(m = 850)， 输 出 冲 激 响 应 就 是 y(n) = h(n), Tk 44 节 中 ， 我 们 将 看 到 
如 何 利用 入 个 系数 (0), AT) REN = 1 和 NN 个 输入 抽样 值 x(0), (1), ---, x (0 — CF — 1) 来 设计 FIR 
TERE. m 时 刻 的 输入 抽样 值 为 x(m)， 廷 时 的 输入 抽样 分 别 为 x(n — 1),…,x(n 一 (N-1). Hi 
XX (4.24) 可 看 出 ,一 个 FIR ARE n 时 刻 的 输入 x(n) 和 多 个 延 时 的 x(n ~ 用 的 信息 来 实 
现 。 它 是 非 递 归 的 ， 不 需要 反馈 和 过 去 的 输出 。 需 要 过 去 输出 的 有 反 书 (递归) 的 滤波 器 将 在 
第 5 章 讨论 。FIR 滤波 器 有 有 时 也 被 称 为 模 向 抽 头 延 壕 症 波 咒 。 

在 初始 条 件 为 0 情况 下 ， 式 (4.24 ) 的 z 变换 为 ; 
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¥(z) = h(0)X(2) + h(1))z X(z) + hQ)z ?X(z) + + h(N -)z " ? X(2) (4.25) 
3k (424) 表示 系数 与 输 人 在 时 域 上 的 眷 积 ， 它 等 效 于 在 频 域内 相 乘 ， 即 ， 
¥(z)= H(z)X(z) (4.26 ) 


其 中 HG) = ZTThOO Ete RR, BD 
Hí(z)- y h(k)z = h(0)- h(Dz + h(29z7 +--+ h(N —1)z 7? 
k=0 


_ hD + h(1)z ^7? + MX" edhN - 1) l (427) 
z 
A (4.27) 表示 HOAN -1 个 极点 ， 所 有 极点 都 位 于 原点 ， 因 此 ，FIR 滤波 器 是 男 有 稳定 的 ， 它 
所 有 的 极点 都 位 于 单位 可 内 ， 困 此 有 时 把 FIR 滤波 器 描述 为 “无 极点 ”滤波 器 。 图 4.2 给 出 了 
A (4.24) 和 式 (4.25) 代表 的 FIR 滤波 器 结构 。 


x(n) ym 





NO) 
图 42 ERER FIR eee 


FIR 滤波 器 的 一 个 非常 有 用 的 特性 就 是 线性 相位 特性 。 线性 相位 特性 在 语音 分 析 方 面 很 有 用 ， 
语音 分 析 里 对 相位 失真 要 求 非常 苛刻 。 例 如 ， 在 线性 相位 情况 下 ， 所 有 输入 正 嘴 分 量 都 有 相同 的 
延迟 ， 和 否则 ， 就 会 产生 谐 波 失真 。 

延迟 输入 抽样 x(n — Kot ned Ree" X(jo), — kT, 它 是 频率 o 的 线 
性 函数 。 相 位 的 导数 定义 为 群 延 时 ， 注 意 它 是 一 个 常数 ， 锰 dB/do =-kT, 


44 FFM BHAA FIR 滤波 器 


利用 傅 里 叶 级 数 法 设计 FIR 滤波 器 是 用 传输 函数 H(z) 的 幅度 响应 去 通 近 要 求 的 幅度 响应 。 要 
求 的 传输 沙 数 为 ; 


Hi@)= M Ce pjece (428) 
其 中 ，C 为 傅 里 叶 级 数 的 系数 ， 利用 归 一 化 频率 变量 v, tv = Fy, SHR ORS, HD 
Fy = FJ2, Bb, (4.28) 所 要 求 的 传输 函数 可 写 为 : 


Hualv) = * Cem (4.289) 
HipoT-2nfF,-xv, Wd «1. RACE: 
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Cy, = 了 Hy (ve^ dy 


-了 [人 H,(v)(cosnzv — jsinnxy)dy (4.30) 
RH Av) AR (频率 选择 性 滤波 器 )， 则 式 (430) 可 简化 为 ; 
C, = [ Ha ())cosnmvdv nzÜ B ( 4.31 ) 


WS Av) sion EARR, HC,- C. 则 有 ， 
上 到 (sianmmvdo=0 


式 (429) 中 ,要 求 的 传输 函数 如 (四 用 无 限 项 系数 来 表示 。 为 了 获得 可 实现 的 滤波 器 ， 我 们 必须 
RAA (4.29 )， 这 样 就 形成 了 逼近 的 传输 函数 ， 


Hv) = $ C,e P (432) 
n=-Q 


EF o RARAC, HEREESIA. ORK., FIR 滤波 器 的 阶 数 越 高 , 35 (432) 就 
. 越 能 逼近 要 求 的 传输 函数 。 用 有 限 项 来 截 短 无 穷 级 数 ， 忽略 -Q 到 +Q HIE AY RS Sh AEB, 
在 4.5 节 中 ， 我 们 会 了 解 到 采用 和 矩形 窗 以 外 的 窗 函 数 可 改进 滤波 器 特性 。 
Sze, RR (4.32) 变 为 ; 
H,(z)= $ Caz" (4.33) 
n=-@ 

冲 激 响 应 系数 为 Cig, Cow. -s Ca, Co, Chp e, Co. Co. KH (4.33) 近似 的 传输 函数 中 ，z 的 
指数 有 正 数 ， 这 意味 着 滤波 器 在 施加 输入 信和 号 前 就 有 输出 ， 因此 涨 波 器 是 非 因果 、 不 可 实现 的 。 
为 了 弥补 这 种 情况 ， 我 们 在 式 (433) HEPAT OMAR NRE, XXFERUER T. 

H(z) = 2° H,(2)= 之 Caz" € (4.34) 

n=-Q 


4n-Qs-i, R (4.34) HAY HYH: | 

H(z) eu (4.35) 
ThzCo. N-1-29, RËR HEH: 

H(z)= Sar (4.36) 


这 里 A(z) AR hu EUR, 且 加 Co h = Coi ,hg = Cu hou = Ca = Ci. = Co, 
种 激 响 应 系数 是 关于 he 对称 的 ， 且 C.= C. 
滤波 器 的 阶 数 是 N= 2Q + 1， 例 如 ， 如 果 Q = 5， 滤 波 器 就 有 11 个 系数 fm hy ho, Bp; 
ho = ho =C; 
h= hs =C, 
h = hg =C; 
h 2h =C, 
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hy = hs =C; 
hs =Co 
43 AT STR ER ae A fe, LIRR. foul. AE, JUPRIDI 
发 现 系 数 C, = Cro 


lH») lA 


IHA] 





n n v 
(c) 带 通 
图 和 3 理想 传输 苗 数 
1、 低 通 : Gsv | 
C, = [" H,()cosnzv dy = SANE (437) 
2. Bie: Co-71-7 
C, Ld dv Am (438) 
3. Wi: CO =n- n 
| C, = f? HalWoosnm dy = S82 Sinn (439) 
4. $BH: Co-1— (2 ~ vi) 
C, = 上 H(v) cos nav de f! H.(v)cosnnv dy = Stm sinn, (4.40 ) 


其 中 图 43 中 所 示 的 入 是 归 一 化 的 截止 频 率 。 目 前 有 几 个 工具 包 可 用 于 FIR 滤波 器 的 设计 ， 
后 面 将 要 讨论 它们 。 在 实现 FIR 滤波 各 时， 我 们 开发 了 一 个 通用 程序， 站 让 名 的 类 型 (例如 x 
论 低 通 还 是 带 通 ) 由 特定 的 系数 确定 。 


练习 4.3 低 通 FIR 滤波 器 


求 一 个 FIR 滤波 器 的 冲 娄 响应 的 系数 ， 其 中 阶 数 六 = 11， 抽 样 频率 为 10 kHz, 截止 频率 为 
f-=1kHz, RR (4.37): 
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这 里 Fy = FLARE, B. 


c, = Sin02nm n-il £2, =, £5. (441) 


AT 
FAA BAY CA, = Co AIC, = Ca, 因此 冲 激 响应 的 系数 为 ， 
fo = ho =0 hy =h, =0.1514. 
hh =0.0468 hy =h =01872 —— 
=; =0.1009 hs =0.2 ^— (442) 


这 些 系数 可 利用 实用 程序 Aa 计算 出 来 ， 再 插 人 到 一 个 通用 滤波 器 程序 里 ， 后 面 
将 讨论 这 些 工 具 软 件 。 注意 这 些 系 数 是 关于 Q = 5 对 称 的 。 对 于 一 个 实际 的 滤波 器 , 阶 数 入 = 11 是 
较 低 的 ， 阶 数 六 加 们 就 可 以 得 到 有 更 好 特性 的 FIR 滤波 器 ， 比 如 在 选择 性 方面 。 “对 于 有 线性 相位 
特性 的 PIR 滤波 项， 如 式 ( 4.42 ) 所 示 ， 系 数 必 须 是 对 称 的 。 


45 ES 


对 式 (4.29 ) FESR TES SORBET HUS, fasst (432) RTE HL, 该 过 程 实质 上 
是 在 -8 到 + 之 间 加 了 一 个 幅度 为 1 的 矩形 窗 函 数 ， 并 忽略 了 窗外 的 各 个 系数 。 EHBE, Q 
REA, 35 (4.32) PARAS, ARRETE (429), FUCEWAIGRIESTSE SON 

Ji oc MEM 
wt 其 他 i (443) 
AEOE f8t ER cns (rr) ERR AAR IE sinc 函数 ， 它 在 频 域 可 表示 为 ， 
sinl ud 


werde Rm EM uu 


n=-0 nxÜ 
由 于 突然 截断 ， 特 别 是 接近 不 连续 .造成 了 sinc BASU HS. . 
ARH RP RAR Role du] AEE, ENEMA RR, RTS 
IDA A. Ri, RSH RR. ERNE Sse, Domiti 
MELEE. GR RARE —T SEE MAT, ERARE SS ENERI ULIS 
进行 比较 ( 即 它们 的 比率 )。 STRAIT REAP ORM, CREE AUT BIRDS BERE, 
RABIN AR MU) ERE RAE RT PGREHEH UD B PR EE (增加 滤波 器 阶 数 ) 来 实现 。 后 面 我 们 
将 画 出 一 个 FIR 恋 波 咒 的 幅 频 响应 及 其 不 理想 的 旁 六 特性 。 
总 之 ， 傅 里 叶 级 数 的 系数 可 写 为 : 





C; =C,w(n) . E (4.45 ) 
H Pw Art HR. TEROEI HF, C = Cr, X (4.36) 中 的 传输 函数 可 写 为 ， 


N-I 
H'(z)= x hiz^ | (4.46) 
fmt} 
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其 中 : . 
k=Co: Ogig20 (4.47) 
AE ARE, SRR HLIUERIIEIE IE 13 dB, 会 导致 较 大 幅度 的 振荡 。 
另 一 方面 , 它 有 最 罕 的 主办， 可 提供 高 选择 性 。 下 面 几 种 窗 函 数 是 在 FIR 滤波 器 设计 中 经 常用 到 
AY ef PR, - 
4.5.1 XIR (Hamming) 窗 
DLL BE aa?) 


t 54 $0.46 cos(nn/Q) hls (448) 


其 他 


Wr(n)= 
其 最 高 eda Y HUS p TAS 比 主 办 峰值 低 43 dB. 


45.2 MP (Hanning) 窗 
DUTBHEERTRASGEWD, HARIN: 


0.54 0.Scos(nt/Q) sQ 
lo D. 其 他 (4.49) 


waa (n) = 
KRASNA TRAD RE PH E EIRAN 31 dB. 
4.5.3 43% (Blackman) 窗 
AHS ABBR. 


^ 42 +05 cos(n/Q)+0. O8cos(2nn/Q)  |n«Q (4,50) 
其 他 


Wan )- 


OR PSR PA Lt ERE 58dB. SRL aT SOE, RES BN a KS 
BE, GAN CHR RRR. SLR eH, EREET He me maa eK 
Buh. v 


454 BASE ( Kaiser) E 


GELE, 用 凯 寒窗 来 设计 FIR 滤波 器 变 得 非常 普遍。 它 有 一 个 可 变 参数 ， 可 以 用 来 控制 旁 
办 与 主因 相对 大 小 。 LER mR Fs — 





_ (Jo (5 Iola) mse 
wdi | 其 他 | | (4,51) 
A Pee REARRENEE, b-a[-(nQY]^. 了 (中 是 第 一 类 修正 贝 塞 尔 函 数 ， 定 义 为 ， 
.1,925€ (0277) [ear | (07 2 (43) 
Bee oy UE 


FREAK, MEANS MS, WISCHUBAN Se ERO DID, 
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45.5 ”计算 机 辅助 逼近 设计 


SEF HAGA (Remez) 交换 算法 的 计算 机 辅助 过 代 设计 是 一 种 有 将 的 方法 ， 科 用 该 方法 可 说 
计 出 近似 等 波动 特性 的 FIR 滤波 器 54。 滤波 器 的 阶 数 及 通 带 与 阻 带 边界 是 固定 的 , 通过 改变 系数 
来 实现 近似 等 波动 特性 ， 这 使 通 带 和 阻 带 的 波动 都 达到 最 小 。 对 过 渡 带 不 加 限制 ， 并 认为 是 “不 
用 关心 ”的 区 域 , 没有 办 法 解决 这 种 情况 。 很 多 商业 滤波 器 设计 软件 包 使 用 Parks-McClellan 算法 
来 设计 FIR 滤波 器 。 


46 C 语言 和 汇编 程序 编程 实例 


在 几 分 钟 内 就 可 设计 和 实现 一 个 实时 的 FIR 滤波 家 ， 有 很 多 滤波 器 设计 软件 包 可 用 来 设计 
FIR 滤波 器 。 附 录 D 中 介绍 使 用 MATLAB'* 来 设计 滤波 器 ， 附 录 E 介绍 使 用 DigiFilter 软件 和 自 
己 设计 软件 包 (在 辅助 材料 中 ) 来 设计 滤波 器 。 D 
”有 多 个 实例 用 来 说 明 FIR OS, 多 数 是 用 C 语言 编写 的 , 少数 是 用 C 语言 与 汇编 混 
合 编程 ， 这 些 实例 用 来 说 明 环形 缓冲 区 的 使 用 ， 利 用 内 部 或 外 部 存储 器 中 的 环形 缓冲 区 更 新 延 时 
抽样 点 是 一 种 更 有 效 的 方法 。 式 (4.24) 的 卷 积 等 式 用 于 设计 和 实现 滤波 咕 ， 即 : 


¥ = 之 ACE)jx(r 一 六 
我 们 可 以 将 冲 激 响应 系数 安排 在 一 个 缓冲 区 (数组 ) 中 ， 第 一 个 系数 h(0) 位 于 缓冲 区 开始 位 
置 单元 (存储 器 低 端 地 址 的 第 一 个 存储 单元 )， 最 后 一 个 系数 AN - 二 位 于 缓冲 区 的 最 后 位 置 单元 
( 存储 器 高 端 地 址 的 最 后 一 个 存储 单元 ), 延 时 抽样 在 存储 器 中 的 安排 是 这 样 的 ， 最 新 的 抽样 x(n) 
位 于 抽样 缓冲 区 的 开始 ， 最 早 的 抽样 zx(z ~ (N - D) ET ABC US, 素数 和 抽样 在 存储 器 中 的 
组 级 如 表 4.1 所 示 。 开 始 时 ， 所 有 抽样 都 设 为 0。 


表 4.1 ”系数 和 抽样 初始 时 在 存储 器 中 的 组 织 


i x 数 TO | 
0 HQ) xin) 
1 ACL) x(n- 1) 
2 h(2) xin- 2) 
N-1 v h(N- 1) x(n-(N-1)) 
一 一 -一 S a 9 _ xn--lD) 
天 时刻 


TE n 时 刻 由 ADC 获得 的 最 新 抽样 x(n)， fF: — cdd n 时 
ZAR ABBR (424) EHE, Bp. 
y(n) = h(0)x(n) + h(1)x(n - 1) +--+ h(N ~ 2)x(n - (N -2) 
+ h(N ~ 1x(n - (N - 1) 
延 时 抽样 接着 被 不 断 更 新 ， 这 样 x(x - k) = x(n + 1 -~ 上) 就 被 用 来 计算 y(n D, y(n + DERE 
时 间 单 元 或 者 说 是 下 一 个 抽样 周期 元 的 输出 。 除 了 最 新 的 抽样 外 ， 所 有 抽样 都 要 更 新 。 例 如 ， 
x(n = 1) = x(n), x(n - (N -1)) =x(n 一 (N-2))， 这 种 更 新 过 程 好 像 在 存储 器 中 把 数据 (向 下 ) 
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Bah (BiH 42, WE n+ 1 时 刻 数据 的 更 新 情况 )。 


BA 57 EN 
En + TRIER DO AB (n », WERTERA. Ra 42 Bos. 。 输 出 
y + 1) 可 按 下 式 计算 ， mE 


y(n + 1) - h(0)x(n 41) FAOn) +-+ h(N —2)x(n - (N - 3) 
+ h(N — 1)x(n - (N — 2) 


随后 抽样 更 新 为 下 一 时 间 单 元 的 抽样 。 DV 100 Sd 
42 更 新 的 抽样 在 存储 竹中 的 组 织 。 


系数 n 时刻 n+l B n+ 2 Bit © 
A(O): xin) Doi o xintl)ho Uo wit 2)> 
bil) | , .. x(n-1) - xin) . e x({a+.1) 
hi2) 0  xí(n-2) x(n-1) xin) | 
h(N-3) x{n~ (N—3)) xin- (N—-4)) x(n- (N—5)) 
h4N- 2) ^o oX(in- (N-2)) x(n- (N-3)) xin- (N—4)) 


AUOT1) o XínciN-21)) ^^ — x(n-(N-2)) ^ . x(n-(N-3)) 


" +2 时 刻 
在 n + 2 时 刻 ， 得 到 新 的 输入 抽 样 x(n + 27， 输 出 变 为 ; | | 
y(n + 2) x h(O)x(n + 2) + h(Tx(n + 1) +--+ + h(N - 1)x(n - (N - 3)) 
在 每 个 时 间 单元 抽样 周期 )， 更 新 延 时 抽样 ， 计 算 滤波 艇 的 输出 ， 该 过 程 一 直 这 样 继续 。 例 4.8 
说 明了 把 系数 和 抽样 存放 在 存储 器 中 ， 并 计算 卷 积 等 式 的 4 种 不 同方 法 ( 例如 ， 最 新 的 抽样 位 于 
缓冲 区 的 最 后 ， 而 最 早 的 抽样 位 于 缓冲 区 的 开始 位 置 单元 ) 


例 4.1 BAA FIR 滤波 器 的 实现 

图 4.4 给 出 了 实现 FIR 滤波 器 的 源 程 序 (FRc) 清单 ， 这 是 一 个 通用 的 FIR 程序 ， 其 中 系数 
文件 bs2700.cof (如 图 4.5 所 示 ) 确定 了 滤波 器 的 特性 。 系 数 文件 有 89 个 系数 ， 表 示 中 心 频率 为 
2700 Hz 的 HR- 带 阻 滤波 器 ,- 系数 的 个 数 NN 也 定义 在 该 文件 中 。 泪 波 器 设计 利 骨 MATLAB ME 
用 户 接口 (GU) 的 滤波 器 设计 工具 SPTOOL 来 设计 的 ， 附 录 DD 对 该 工 具 进 行 了 介绍 a 468 
出 了 文 波 器 的 特性 ( MATLAB 的 38 阶 滤波 器 对 应 89 PMS 

延 时 的 抽样 存放 在 缓冲 区 dlyLN] 里 ， 最 新 的 输入 抽样 x(n) 出 alyl0] 得 到 并 存放 在 缓冲 区 的 开 
始 处 ， 而 系数 存放 在 另 一 个 缓冲 区 再 隔 中 ， HOARE RR R * 4.1 给 出 了 抽样 和 系数 分 别 
位 于 各 自 缓 冲 区 中 的 组 织 方式 。 

在 中 断 服务 子 程序 中 有 两 个 for 循环 ( 将 用 一个 循环 实现 FIR. — ) 第 一 个 循环 实现 在 特 
定 的 a 时刻 N 个 系数 入 个 抽样 的 着 积 。 EISE fp " 


y(n) = h(0)x(n) + h(Ix(n = 1) +--+ MN - «(n - w -1) 
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/fFfir.c FIR filter. Include coefficient file with length N 


#include *bs2700.co£* "//coa£fficient file BS & 2700Hz 


int yn = 0; //initialize filter's output 
short dly [N]: //delauy samples 
interrupt void c inti1() g //ISR 
í 
short i; 


dlyl0] = input, sample(); //newest input @ top of buffer 
yn = Q; //initialize filter’s output 
for (i = 0; i< N; i++) 

Yn += (人 fi * dly[il): //yin) += híi)* xín-i) 
for (i = N-1; i > 0; i--) //starting @ bottom of buffer 


diy[(i] = dly[i-l]: //update delays with data move 
output sample(yn >> 15); /f/output filter 
return; 


} 


void maini) 

i 
comm_intr{); //init DSE, codec, McBSP 
while(1): - //infinite loop 

} 

eee 
图 44 通用 FIR 设计 程序 (FIR.c ) 
//882700.cof FIR bandstop coefficients designed with MATLAB 


#define N 89 //number of coefficients 


short h[N]-(-14,23,-9,-6,0,8,16, -58,50,44, -147, 119,67,-245, 
200,72,-312,257,53,-299,239,20,-165,88,0,105, 
-236,33,490,-740,158,932,-1380,392,1248,-2070, 
724,1650,-2690,1104,1776,-3122,1458,1704,29491. 
1704,1458,-3122,1776,1104,-2690,1650, 724,-2070, 
1348, 392, -1380,932,158,-740,490,33,-236,105,0, 
88, -165,20,239,-299,53,257,-312, 72,200, -245, 67, 
119, ~147,44,50,-58,16,8,0,~6,-9,23,-14}; 


图 4.5 WE PIR 泪 波 器 的 系数 (bs2700.cof ) 


在 第 二 个 循环 中 ,更新 延 时 的 抽样 ， 计算 n + 1 时 刻 的 输出 y(n)， 即 y(n + 了。 新 采集 和 的 输入 机 
样 始终 在 ( 本 例 中 ) 抽 样 缓冲 区 的 开始 位 置 单元 存储 x(n) 的 存储 单元 现在 存储 新 的 抽样 x(n + 1), 
申 此 计算 出 n+ 1 时 刻 的 输出 y(n+1)， 这 种 方法 利用 数据 移动 来 更 新 延 时 抽样。 | 

例 48 说 明了 有 多 少 种 不 局 同 存储 器 组 织 方法 可 用 于 延 时 抽样 值 与 滤波 器 系数 的 存储 更 新 ;以 及 
和 卷 积 等 式 在 同一 个 循环 内 延 时 扩 样 的 更 新 方法 。 我 们 还 介绍 了 使 用 带 指针 的 环形 缓 种 区 更 新 延 
时 抽样 ， 替 代数 据 移动 的 方法 。 输 出 在 送 到 编 解 码 器 DAC 之 前 ( 右 移 15 位 )， 这 样 实现 输出 的 
定 标 ， 这 种 方法 也 适合 于 定点 实现 使 用 。 
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图 4.6 MATLAB 滤波 器 设计 工具 SPTOOL， 显 示 
中 心 频率 为 2700 Hz 的 带 阻 滤波 器 的 特性 


中 心 频率 为 2700 Hz 的 带 阻 滤波 器 

建立 并 运行 工程 FIR, 输入 一 个 正弦 信号 , 并 使 频率 在 2700 Hz 上 下 稍微 变化 , 检验 在 2700 Hz 
时 输出 是 最 小 的 。 

图 4.7 给 出 了 该 工程 的 CCS 窗口 ， 它 显示 了 采用 128 点 FFT 得 到 滤波 器 系数 h ( 见 例 1.3, 
起 始 地 址 为 h) 的 幅 频 特性 ， 同 时 也 显示 了 中 心 频率 在 2700 Hz 的 FIR 带 阻 滤波 器 的 特性 。 该 图 
还 显示 了 CCS 时 域 图 ， 即 滤波 器 的 冲 激 响应 。 


图 4.7 CCS 图 : 带 阻 滤波 器 系数 的 幅 频 特 性 (FFT) 和 冲 激 响 应 


用 噪声 作为 输入 可 以 检验 带 阻 滤波 器 的 输出 频率 响应 。 如 后 面 所 介绍 的 ， 可 用 第 2 章 中 产生 
的 擅 随 机 噪声 序列 或 另 一 个 噪声 源 ( 见 附录 D) 作为 FIR 滤波 器 的 输入 。 图 4.8 给 出 了 一 个 实时 
实现 且 在 2700 Hz 处 幅度 凹陷 的 滤波 器 幅 频 特性 图 。 该 图 是 通过 将 分 析 仪 产生 的 噪声 作为 输入 ， 
然后 再 用 HP3561A 动态 信号 分 析 仪 得 到 的 。 在 大 约 3500 Hz 处 的 滚 降 是 由 于 编译 码 上 的 抗 混 合 低 
通 滤波 器 的 影响 所 造成 的 。 
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中 心 频 率 为 1750 Hz 的 带 通 滤波 器 

在 CCS 中 ， 编 辑 FIR.c 程序 ， 用 系数 文件 bp1750.cof 替代 文件 bs2700.cof， 文 件 bp1750.cof 
表示 中 心 频率 为 1750 Hz 的 带 通 FIR 滤波 器 , 如 图 4.9 所 示 。 该 滤波 器 是 用 MATLAB 的 滤波 器 工 
F SPTOOL 设计 的 ( 见 附录 D ), 选择 菜单 incremental Build, 新 的 系数 文件 bp1750.cof 就 自动 添 
加 到 工程 了 ， 再 运行 和 检验 中 心 频率 为 1750 Hz 的 带 通 FIR 滤波 器 的 特性 。 图 4.10 给 出 了 用 HP 
信号 分 析 仪 得 到 的 滤波 器 输出 频率 响应 的 实时 图 形 。 





图 4.9 MATLAB SPTOOL 工具 设计 的 中 心 频率 为 1750 Hz 的 FIR 带 通 滤波 器 特性 
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图 4.10 中 心 频率 为 1750 Hz 的 带 通 滤波 器 的 输出 频率 响应 ， 该 图 是 用 信号 分 析 仪 得 到 的 
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H 4.2 


= FIR 低 通 滤波 器 对 话音 的 影响 


”图 4.11 给 出 了 程序 FIR31pc, 该 程序 实现 了 三 个 低 通 洪波 器 , REMAK 600 Hz, 1500 Hz 
和 3000 Hz。 三 个 低 通 滤波 回 都 是 用 MATLAB 的 SPTOOL 工具 设计 的 ， 生 成 三 组 相应 的 系数 。 
该 例 是 在 例 4.1 通用 FIR 程序 基础 上 扩展 而 来 的 。 


//FIR3LP.c FIR using three lowpass coefficients with 


#include 
#include 
#include 


"lp600.cof" 
*"lpl1500.cof" 
"lp3000. cof” 


short LP number = 1; 


int 


yn - 0; 


short diy([N]; 
short h[3] [N]; 


1 


interrupt void c_intil(} 
short i; 
dly[0] = input sample(); 
yn - 0; 
for (i = 0; i< N; i++} 


} 


yn -4-(h[LP mumber]ii]*dlylil):. 


for (i = N-1; i > 0;"É--): 

dly(i] = dlyii-1]; ` 
output. sample(yn - 15); 
return; . 


void main() 


t 


short i: 


for (i-0; ik; i++ — 
{ 
'"diylil = 0; 
h[1][i]) = hlp600li]; 
h[2][i] s hiPp1500[i); 
h[3][il = hlp3000[il: 
1 
comm intr(); 


while(l): 


thrée different BW 
//coeff file LP @ 600 Hz 
//Ccoetf file LP @ 1500 Hz 
//coeff file LP @ 3000 Hz 
//start with ist LP filter 
//initialize filter's output 


J/delsy samples . 


//filter characteristics 3xN 


//ISR 


//newest input 8 top of buffer 
//initialize filter output 


4/y(n), += h(LPÉ, i)*x(n-i) 


J/atarting @ bottom of buffer 
7 ffuüpdate: delays with data move 
^ /foutput Biter 


//return from interrupt 


//init buffer 

//s8tart addr of LP600 coeff 
//start addr of LP1500 coeff 
//start addr of LP3000 coeff 


//init DSK, codec, 
//infinite loop 


McBSP 





图 4.11 点 击 滑动 图 标 选择 实现 三 个 不 同 FIR 滤波 器 的 程序 (FIR3LP oc) 


LP number 选择 需要 实现 的 低 通 滤波 器 ， 例 如 ， 如 果 LP number 设置 为 1， 则 hl1] 呈 就 等 于 
hlp6O0;] ( 在 函数 main 的 for 循环 内 )， 它 是 第 一 个 系数 业 的 地 址 。LP600.cof LERNEN., 
止 频率 为 600 Hz, RA 81 个 系数 的 FR 低 通 滤波 器 的 系数 文件 。 图 4.12 显示 了 该 系数 文件 (其 
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他 两 个 系数 集 在 辅助 材料 中 ), 然 后 实现 该 滤波 器 ,LP_number 可 以 改 为 2 或 3 来 分 别 实现 1500 Hz 
或 3000 Hz 的 低 通 滤波 器 。 利 用 GEL 文件 FIR3LPgel ( 如 图 4.13 所 示 )， 可 以 把 LP_number 从 1 
变 到 3， 点 击 Filter 下 的 箭头 图 标 从 而 选择 实现 三 个 不 同 的 滤波 器 。 

建立 工程 FIR3LP， 用 .wav 文件 TheForce.wav ( 在 辅助 材料 中 ) 作为 输入 (参见 附录 了)， 现 
察 三 个 低 通 滤波 器 对 输入 话音 的 影响 。 选 择 600 Hz 较 低 的 带宽 , 使 用 第 一 个 系数 集 , 语音 信号 高 
于 600 Hz 的 频率 分 量 被 搞 制 掉 了 , 把 输出 连接 到 喇 典 或 频谱 分 析 仪 上 , 检查 一 下 结果 如 何 ?” 观察 
三 个 不 同 FIR 滤波 器 的 带宽 。 CO 


//LP600.cof FIR lowpass filter coefficients using Kaizer window 
#define N 81 //length of filter 


short hlp600[N] - (0, -6,-14,-22,-26,-24,-13,8,34,61,80,83,63,19, -43, -113, 
-171,-201,-185,-117,0,146,292,398,428,355,174,-99,-416, -712, -905, -921, 
-700, -218,511,1424,2425,3391,4196,4729,4915,4729,4196,3391,2425,1424, 
511,-218,-700,-921,-905,-712,-416,-99,174,355,428,398,292, 146,0, -117, 
7185,-201,-171,-113,-43,19,63,83,80,61,34,8,-13,-24, -26, -22, -14, -6,0); 


图 4.12 规 止 频率 为 600 Hz 的 FIR 低 通 凑 波 器 系数 文件 (LP600 cof) 
/ *FIR3LP.gel Gel file to step through 3 different LP filters*/ 
menuitem "Filter Characteristics? 
slider Filter(1,3,1,1,fülterparameter) /*from 1 to 3,iner by 1*/ 
{ 


LP number = filterparameter; /*for 3 LP filters*; . 
} 





图 4.13 ”选择 三 个 FIR 低 通 滤波 器 系数 的 GEL 文件 € FIR3LP.gel ) 


例 43 低 通 、 高 通 、 带 通 和 带 限 4 种 不 同 滤波 顺 的 实现 

该 例 与 例 42 类 似 ,说 明 使 用 GEL ( 滑动 条 ) 文件 选择 4 种 不 同类 型 的 滤波 器 ， 滤 波 回 是 合 
FH MATLAB 的 SPTOOL 工具 来 设计 的 ， 每 个 滤波 器 有 81 个 系数 ( 在 辅助 材料 中 ) 这 4 个 系数 
文件 分 别 是 : 


.p1500.cof， 带 宽 为 1500 Hz 的 低 通 滤波 器 。 
，hp2200.cof， 带 宽 为 2200 Hz 的 高 通 滤波 器 。 
-bp1750.cof， 中 心 频率 为 1750 Hz 的 带 通 滤波 器 。 
，bs790.cof， 中 心 频率 为 790 Hz PUER E DERE 


BUT FIR4types.c ( 在 辅助 材料 中 ) 实现 了 该 工程 。 将 程序 FIR3LPc (RH 42) 稍 加 修改 ， 
就 能 实现 第 四 个 滤波 器 。 

建立 并 运行 工程 FIR4types， 装载 GEL 文件 FIR4types.gel ( 在 辅助 材料 中 ), 检验 4 种 不 同 的 
FIR 滤波 器 ， 该 例 可 很 容易 地 扩展 到 实现 更 多 的 FIR 滤波 器 。 

图 4.9 显示 了 中 心 频率 为 1750 Hz 的 带 通 FIR 滤波 器 的 特性 ， 该 滤波 器 是 用 MATLAB 滤波 器 
设计 工具 设计 的 ， 图 4.10 显示 了 用 HP 信和 号 分 析 仪 获得 的 频率 响应 。 


È V No 
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例 44 BOMALE ESRAR FIR 滤波 器 的 实现 . 

程序 FIRPRN.c (如 图 4.14 所 示 ) 实现 了 FIR 滤波 着 ， 并 用 "— HEED 

器 的 输入 。 输 人 是 例 2.16 ^E RAPER OLR HEX], MOC BP55.cof JE RITE ARH, d 

图 4.15 R. 滤波 髓 开发 工具 包 ( 在 辅助 烤 料 中 ) 产生 浮 点 或 十 六 进 制 格式 的 泪 波 器 系数 ， 附 
录 已 对 此 进行 了 介绍 。 ] 该 文件 表示 中 心 项 率 为 屎 4、 包 售 5 个 系数 的 FIR 带 通 沪 波 器 。 





77ZIRBPRMN.O FIR with internally generated input noise sequence | 


#include “bp55.cof? //BP 8 Fa/4 coeff file in Boat 
#include "noise gen.h^ ` //header fle for noise sequence 
int dlyIN]; //delay samples 

short fb; //feedback variable 


shift reg sreg; 


short prn(void) (7 / /pseudorandom noise generation 
( TU 
short prnseq; //for pseudorandom sequence 
if(sreg.bt.b0) . f#fsequence {1,-1) 
prnseq = -16000; //scaled negative noise level 
else . . 
prnseq = 16000; //scaled positive noise level 
fb s(sreg.bt.b0)^(sreg.bt.b1):; //XOR bits 0,1 
fb ^-(sreg.bt.bll)^(sreg.bt.b13); //with bits 11,13 -»fb 
sreg.regval<<=1; //shift register 1 bit to left 
sreg.bt.b0 = fb; - //close feedback path 
return prnseq; f/xreturn sequence’ 
} 
interrupt void ¢_int11(} ` //ISR 
( 
int i; ' : ' 
int yn = 0; n mE //initlalize filter's output 
dly[O] = prn(; //input noise sequence 
for (i = 0; i« N; i++) 
yn *-(h[i]*dlvlil): //yin)*- h(ib*x(n-i) 
for (i = N-1; i > 0; i--) //start 8 bottom of buffer 
dly[i] = dly[i-1]: Fiata move to update delays. 
output, sampie (yn); /foutput filter . 
return; /freturn from interrupt 


} 


void main() 
{ . 
short i; 
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sreg.regval = OxFFFF; //shift register to nominal values 
fb = 1; //initial feedback value 
for (i = 0; i«N; i++} 
dly[i] = 0; //init buffer 
comm intrí!; /finit DSK, codec, McBSP 
while(1); //infinite loop 





图 4.14 用 檀 随 机 序列 作为 输入 的 FIR 程序 C FIRPRN.c) 


建立 并 运行 工程 FIRPRN， 检 验 生成 的 滤波 器 是 否 是 一 个 中 心 频率 为 2 kHz 的 FIR 带 通 滤波 
器 。 为 了 检验 噪声 序列 的 输出 ， 调 用 output sample Agtt, Hii aly[OM tie yn 即 可 。 


//bp55.cof Coefficients for bandpass FIR filter centered @ Fs/4 
fdefine N 55 //number of coefficients 


float h[N]- 
[1.7619E-017, 7.0567E-003, 2.2150E-018,-1.09625-002, 4.0310E-017, 
1.3946E-002, 7.1787E-D18,-1.4588E-D02, 3.9928E-017, 1.1474E-002, 
5.9881E-018,-3.5159E-003,-6.6174E-018, -9.7476E-003,-1.79192-017, 
2.7932E-002,-9.4329£-017,—4.3740E-002, 3.3834E-017, 7,3066£-002, 
73.6228E-017,-9.5284E-002, 3.2194E-017, 1.1365E-001,-2.2165E-017, 
-1.25"76E-001, 7.8980E-018, 1.3000E-001, 7.8980E-018,-1.25756E-001, 
-2.2185E-017, 1.1365E-001, 3.2194E-017,-9.5284E-002,-3.6228E-017, 
7.3066E-002, 3.3834E-017,-4,9740E-002, -9.4329E-027, 2.7932E-002, 
-1.7919E-017,-9.7475E-003,-6.6174E-018,-3.5159E-003, 5.9881E-018, 
1.1474E-002, 3,9928E-017,-1.458BE-002, 7.1787E-018, 1.3946E-002, 
4.0310E-017,-1.0962E-002, 2.2150E-D18, 7.0567E-003, 1.7613E-017); 


图 4.15. PLEA F/A FR 带 通 滤波 器 的 泽 点 格式 系数 文件 ( BP55.cof ) 


测试 不 同 的 FIR 滤波 器 
停止 程序 运行 ,编辑 C 语 言 源 程序 ， 添 加 和 测试 表示 不 同 FIR 滤波 器 ( 在 辅助 材料 中 ) 的 系 
数 文件 ， 所 有 系数 使 用 浮 点 格式 ， 除 了 combi4.cof 文件 外 ， 每 个 系数 文件 含有 55 个 系数 。 


，BS55.cof， 中 心 频率 为 F/4 的 带 阻 滤波 器 。 

， 了 BP55.cof， 中 心 频率 为 已 /4 的 带 通 滤波 器 。 
，LP55.cof， 截 止 频率 为 屎 /4 的 低 通 滤波 器 。 

. HP55.cof, A979 FJAB) FOR IEEE. 

Pass2b.cof， 具 有 两 个 通 带 的 滤波 回 。 

. Pass3b.cof, AA — 43 P HIRES. 

Pass4b.cof， 具 有 凤 个 通 带 的 滤波 器 。 

Stop3b.cof， 具 有 三 个 阻 带 的 滤波 器 。 
，Comb14.cof， 多 个 陷 波 点 的 滤波 其 《 梳 状 滤波 家 )。 


图 4.16(g) 显 示 了 用 系数 文件 pass2b.cof AA BIT HAY FIR 背 波 器 的 实时 输出 频率 响应 ， 该 
滤波 器 是 用 MATLAB 设计 的 .图 4.16(h) 显 示 了 系数 交 件 为 comb14.cof 的 梳 状 滤波 器 的 频率 响应 ， 
该 图 是 用 HP 3561A 信 生 分 析 仪 得 到 的 。 


加 


Mw 
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t i dBy STATUS: PAUSED 
RANGE® 1 RMSrie9 - 






Y: 3.85 dBV 
05 (e 具有 两 个 通 带 的 DIR ERES 
RANGE! 1 dBV STATUS! PAUSER 
. LL : RMS 10g 


START! 8 Wz Bur 38.194 Hz STOPi 4 BO Hz 
Mt @ Hz 






-%0 i NE : n : ， Da xo i: 0]. 

START: @ H Bur 38.194 Hz Stop, 4 @ 

xt à Hz 7 vt 3,85 apy STO 9e Hz 
(b) FIR SURE 


图 4.16 用 HP 分 析 仪 得 到 的 输出 频率 响应 . 


$445 用 CCS 设计 具有 频率 响应 图 形 的 FIR 滤波 器 

图 4.17 给 出 了 程序 FIRbuf.c, 该 文件 实现 了 一 个 FRERES, ELIT 出 存 入 组 六 区 
P, 然后 用 CCS 画 出 滤波 器 频率 响应 的 FFT 幅度 谱 。 例 4.1 介绍 了 重用 有 运用 程序 以 及 要 求 的 滤波 
器 幅度 特性 文件 实现 FIR 滤波 器 的 过 程 。 例 1.2 介绍 了 怎样 把 粮 出 保存 到 缓冲 区 , 以 便 在 CCS 运 
行程 序 内 画 出 响应 的 图 形 。 程 序 FIRbut.c 基于 前 面 的 两 个 例子 ， 系 数 文件 bp41.cof 表示 中 心 频率 
在 1kHz、 具 有 41 个 系数 的 FIR 带 通 滤波 器 ,输出 缓冲 区 的 大 小 是 1024。 
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//Firbuf.c FIR filter with output in buffer plotted with ccs 


#include "bp41.cof" 


int yn = 0; 

short dly[N]: 

short buffercount = 0; 
const short bufferlength = 
short yn, buffer[1024]; 


1024; 


interrupt void c intli() 
1 


short i; 


dly[0] = 
yn = 0; 
for {i = 0; 


input sample); 


i< N; i++} 


yn *z(h[i]*àdly[il) >> 15; 


for (i = N-1; 
dly[i] = 


i > 0; 
diy[i-1]; 


i--) 


output_sample (yn); 


yn.buffer[buffercount] = 

buffercount--*; 

if(buffercount--bufferlength) 
buffercount = 0; 

return; 


vni 


void main() 

{ 
conm_intr (); 
while(1); 


//BP @ 1 kHz coefficient file 


/finitialize filter's output 
//delay samples 

//init buffer count 
//buffer size | 

//output buffer 


//ISR 


//newest input 8 top of buffer 
//initialize filter's output 


//yin)b*zh(i)*x(n-i) 
//start 8 bottom of buffer 
//data move to update delays 


//output filter 


//filter's output into buffer 
//increment buffer count 
//if buffer count = size 
//reinitialize buffer count 
/freturn from interrupt 


//init DSK, codec, 
//infinite loop 


MCBSP 





图 4.17 EUR aR UL UR A SEE) FIR 程序 ( FIRbuf.c) 


建立 工程 FIRbuf， 检 验 输 出 是 否 是 中 心 频率 为 1 kHz 的 带 通 滤波 器 ， 停 止 处 理 器 的 运行 。 
用 噪声 作为 滤波 器 的 输入， 利用 CCS 画 出 输出 频率 响应 图 形 。 用 共享 软件 Goldwave 生成 包 


括 噪 声 在 内 的 不 同 信号， 使 用 声卡 产生 模拟 输出 信号 (参见 附录 所 )。 声 卡 输出 由 Goldwave 产生 
的 噪声 ， 输 出 信和 号 可 作为 DSK WHA. 


选择 菜单 View—Graph—-Time/Frequency , 为 下 列 条 目 设 置 适当 的 值 ， 


. Display type : FFT magnitude 
Start address: yn, buffer 

. Acquisition buffer size: 1024 
FFT frame size: 1024 


B w H = 
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5. FFT order: 10 

6. DSP data type: 16-bit signed integer 

7. Sampling rate: 8000 Hz 

其 他 部 分 使 用 默认 值 ，FFT 的 阶 数 是 M, HPM = FFT 帧 长 。 运行 程序 ， 检 验 图 4.18 画 出 
的 滤波 器 输出 频率 响应 。 


K [Texas Instruments ]/CPU CE 1 - Code Composer Stucho [Graphi Pale! xi 





E) C6xdsk cmd 
3 OSP/BIDS Contig 
Dj Generated Files 


图 4.18 工程 FIRbuf 用 外 部 噪声 作为 滤波 器 输入 , CCS 画 
出 的 1 kHz 带 通 FIR 滤波 器 输出 频率 响应 图 形 


例 4.6 用 内 部 产生 的 伪 随 机 噪声 作为 滤波 器 输入 ， 并 将 输出 保存 到 存储 器 的 FIR 滤波 器 

该 例 建立 在 例 2.16 程序 noise, gen 和 例 4.5 程序 FIRbuf 的 基础 上 ,前 者 产生 伪 随 机 噪声 序列 ， 
后 者 实现 FIR 滤波 器 ， 并 将 滤波 器 输出 也 保存 到 存储 缓冲 区 。 图 4.19 给 出 了 程序 FIRPRNbuf c, 
它 实 现 了 该 例 的 工程 。 

滤波 器 的 输入 是 软件 产生 的 噪声 序列 ， 用 dly[0] 作 为 最 新 的 噪声 序列 ， 系 数 文件 BP41.cof 和 
例 4.5 一 样 ， 表 示 含 有 41 个 系数 的 FIR 带 通 滤波 器 。 

建立 并 运行 工程 FIRPRNbuf, 检验 1 kHz 带 通 滤波 器 的 输出 频率 响应 。 Goldwave 软件 也 可 以 
当成 粗略 的 谱 分 析 仪 ， 得 到 滤波 器 的 频率 响应 (DSK 的 输出 连接 到 声卡 的 输入 )。 

使 用 CCS， 检 验 如 图 4.20 所 示 的 1024 点 的 FFT 幅度 谱 图 。 输 出 缓冲 区 的 地 址 是 yn_buffer， 
图 4.21 给 出 了 中 心 频率 为 F/8 的 FIR 带 通 滤波 器 的 频率 响应 ， 该 图 是 由 HP 分 析 仪 获得 的 。 
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//FIRPRNbuf.c FIR filter with input noise sequence & output in buffer 


#include "bp4l.cof* //BP @ 1 kHz coefficient file 
finclude "noise, gen.h" //header file for noise sequence 
int yn = 0; //initialize filter's output 
short dly[N]; //delay samples 

short buffercount = 0; //init buffer count 

const short bufferlength - 1024; /f/buffer size 

short yn buffer[1024]; //output buffer 

short fh; //feedback variable 


shift reg sreg; 


short prn{void) //pseudorandom noise generation 
{ 
short prnseq; //for pseudorandom sequence 
if(sreg.bt.b0) //sequence (1,-1) 

prnseq - -8000; //scaled negative noise level 
else 

prnseq - B000; //8caled positive noise level 
fb s(sreg.bt.bü)^(sreg.bt.b1); //XOR bits 0,1 
fb ^-(sreg.bt.bll)^(sreg.bt.b13); //with bits 11,13 -»fb 
sreg.regval<<=1; //Sshift register 1 bit to left 
sreg.bt.b0 = fb; //Close feedback path 


return prnseq; 


} 


interrupt void c_intli() //ISR 
{ 
short i; 
dly[0] = prn(); /finput noise sequence 
yn = 0; /finitialize filter's output 
for (i = 0; i« N; i++) 


yn *-(h[il*dly[i]) »»15; //yin)t-h(i)*x(n-i) 
for (i = N-1; i > 0; i--) //start @ bottom of buffer 
dly[íi] = dlvíi-1); //data move to update delays 
output_sample (yn); //output filter 


yn buffer[buffercount] = yn; //filter’s output into buffer 


buifercount++; /fincrement buffer count 
if(buffercount--bufferlength) //if buffer count = size 
buffercount = 0; //reinitialize buffer count 

return; //return from interrupt 

} 

void main(í) 

i 
sreg.regval = OxFFFF; //shift register to nominal values 
fh = 1; //initial feedback value 
comm intrí); //init DSK, codec, McBSP 
while(1); //infinite loop 

} 


ee 
图 4.19 输入 伪 随 机 噪声 序列 ， 输 出 保存 到 存 赃 器 的 FIR 程序 ( FIRPRNbufc } 
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改变 输出 缓冲 区 ， 使 用 yn_buffer[ = dly[0]， 将 噪声 序列 保存 在 存储 器 中 ， 再 运行 程序 ， 夯 
出 噪声 序列 的 FFT 幅度 谱 。 由 于 输出 的 结果 没有 平均 ， 所 以 输出 的 谱 图 不 够 平坦 。 

也 可 以 在 程序 里 使 用 output_sample(dly[0]) 输 出 噪声 序列 ， 利 用 有 平均 功能 的 频谱 分 析 仪 输 
出 ,检验 在 编 解码 器 上 抗 混 秋 滤波 器 带宽 3500 Hz 内 ， 噪 声 频 谱 是 否 是 很 平坦 的 〈 就 像 带宽 为 
是 3500 Hz 的 低 通 滤波 器 )。 图 4.22 显示 了 使 用 HP 频谱 分 析 仪 (具有 平均 功能 ) 获得 的 噪声 序列 频 
谱 ， 使 用 GEL 文件 产生 滑动 条 ， 确 定 DSK 的 输出 是 内 部 产生 的 噪声 序列 dly[0] 还 是 滤波 器 的 输出 。 


ti DSR exot insti CPL [MN 'TARI ode Compose: Studw | LET mr 
/C6x11 DSK (Texas lnstruments/CPU. 1 - C6711 - Code Composer Studio - e 2 


tS CJ Projects 
5 gg FIRPRNbuf. pit 
[8] COxdsk. cmd 
局 DSP/8IOS Contig 





420 工程 FIRPRNbuf 利用 内 部 产生 的 噪声 序列 作为 滤波 器 的 输 
A, CCS 画 出 的 1 kHz FIR 带 通 滤波 器 的 输出 频率 响应 


RANGE? 1 dBy s f USs PAUSED 






Hz STOP! 4 088 Hz 


5 , 
T! H 
doo uz" Yt 


图 4.21 利用 HP 频谱 分 析 仪 获得 的 1 kHz FIR 带 通 滤波 器 的 频率 响应 
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图 4.22 使 用 频谱 分 析 仪 获得 的 内 部 噪声 序列 的 功率 谱 


例 4.7 使 用 两 个 陷 波 只 恢复 受 干扰 的 语音 


该 例 说明 实 现 两 个 陷 波 器 《 带 阻 ) FIR 滤波 器 ， 消 除 输 人 语音 信 号 中 不 希望 的 两 个 正弦 信号。 
用 Goldwave 软件 在 语音 信和 号 ( 辅助 材料 中 的 TheForce.way ) 中 加 入 频率 为 900 Hz 和 2700 Hz 的 
信号 ,这样 得 到 有 干扰 的 输入 信号 corruptvoice.wav ( 在 辅助 材料 中 小 

图 4.23 给 出 了 陷 波 器 程序 NOTCH2.c， 它 实现 了 两 个 级 联 的 滤波 器 。 系数 文件 BS900.cof 和 
BS2700.cof ( 在 辅助 材料 中 ) 是 使 用 MATLAB 软件 设计 的 ， 每 个 文件 含有 89 PRR, EIRE 
程序 NOTCH2.c 中 ， 分 别 表示 中 心 频 率 在 900 Hz 和 2700 Hz 的 两 个 FIR Nik. AKATE i 
REE MSE TENTS, 第 一 个 中 心 频率 为 900 Hz 的 陷 波 器 的 输出 是 第 二 个 中 心 频 率 为 2700 Hz 


的 陷 波 器 输入 。 





//Motch2.C Two FIR notch filters to 


#include *BS900.cof* 
#include *BS2700.cof* 
short dlyl[N]-10); 
short dly2[N]-(0); 


int ylout = 0, yout = 0; 
short out type = 1; 
interrupt void c int11|) 
1 
short i; 
dlyl[0] = input sample(); 
ylout z 0; 
y20ut = 0; 
for (i = 0; i< N; i++) 


ylout += h900[il*dlyl[i]; 


diy2[0]s(ylout >>15); 
for (i = 0; i« N; i++) 
y2out += h2700[i]*dly2[i]; 





remove two sinusoidal noise Signals 


//BS € 300 Hz coefficient file 
//BS @ 2700 Hz coefficient file 
//delay samples for lat filter 
//delay samples for 2nd filter 
//init output of each filter 
//slider for output type 


//ISR 


//newest input @ top of buffer 
//init output of Ist filter 
/finit output of 2nd filter 
/fylin)+=h900 (i) *x(n-i) 


//out of lst filter->in 2nd filter 


//y2 (n)+=h2700 (1) *x{n-i) 
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for (i s N-1; i > 0; i--) //from bottom of buffer 
{ 
dlyl(i] = dlyl[i-1]; //update samples of 1st buffer 
dly2[i] = dly2[i-1]; //update samples of 2nd buffer 
) 
if (out type--1) //if slider is in position 1 
output sample (dly1[0]); //corrupted input (voice+sines) 
if (out_type==2) 
output sample(y20out»»15); //output of 2nd filter (voice) 
return; //return from ISR 


) 


void main() 

{ 
comm intr(); //init DSK, codec, McBSP 
while(1); //infinite loop 





图 4.23 ”消除 两 个 干扰 信号 的 两 个 级 联 FIR 陷 波 器 程序 ( NOTCH2.c ) 


建立 工程 NOTCH2, 输入 (播放 ) 有 干扰 的 语音 文件 corruptvoice.wav， 检 查 滑动 条 在 第 一 个 
位 置 ( 与 初始 设置 一 样 ) 时 ， 选 择 如 图 4.24 显示 的 有 干扰 的 话音 。 该 图 是 用 DSK 的 输出 作为 声 
卡 〈 人 参见 附录 E) 的 输入 ， 并 利用 Goldwave 软件 画 出 的 。 因 为 使 用 单 声 道 信号 ， 所 以 只 显示 了 
一 个 声 道 的 信和 号 ( 左 声 道 ), 观察 分 别 在 900 Hz 和 2700 Hz 的 两 个 尖峰 脉冲 ( 表示 两 个 正弦 信号 )。 
将 滑动 图 标 放 到 第 二 个 位 置 ， 检 查 两 个 不 希望 的 信号 是 否 被 去 除了 。 

同样 ， 通 过 函数 output sample ( 重建 ) 输出 ylout， 检 验 单独 的 2700 Hz 的 频率 干扰 输入 信 
号 的 情况 。 





图 4.24 受 900 Hz 和 2700 Hz 两 个 正弦 信和 号 干扰 的 话音 频谱 ( 利用 Goldwave 软件 得 到 ) 
例 4.8 使 用 4 种 不 同方 法 实现 FIR 
图 4.25 显示 了 程序 FIR4ways.c， 该 程序 使 用 4 种 方法 卷 积 /更 新 延 时 抽样 实现 FIR 滤波 器 。 


该 例 扩展 了 使 用 第 一 种 方法 (方法 A ) 的 例 4.1。 在 第 一 种 方法 中 , 使 用 两 个 for 循环 ， 延 时 抽样 
保存 在 存储 器 中 ， 且 最 新 的 抽样 放 在 缓冲 区 的 开始 ， 最 早 的 抽样 放 在 缓冲 区 的 末尾 ， 最 新 的 抽样 
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和 第 一 个 系数 利用 下 面 的 公式 进行 着 积 : 
y(n) = A(O)x(n) + h(1)x(n - 1) 9 - RIN - Dx(n - (N - 1) 








//FIRÁways.c FIR with alternative ways of storing/updating samples 


#include "bp4l.cof* //BP @ 1 kHz coefficient file 

#define METHOD "D' //change to B or C or D 

int yn = 0; //initialize filter's output 

short dly[N-1]; //delay samples array(one extra) 

interrupt void c_inti1(} //ISR 

{ 
shert i; 
yn = 0; - //initialize filter's output 

#if METHOD == 'A' //if lst method 
dly[0] = input sample():; //newest sample 8 top of buffer 
for (i = 0; i« N; i++} 

yn += (h[i] * dly([il): //y n) shí0] *x[n] +. . «*h[N-1] x[n- (N-1) 
for (i = N-1; i > 0; i--) //from bottom of buffer 
dly[i] = dly[i-1]; //update sample data move "down* 

#elif METHOD == ^B' | //i£ 2nd method 
diy[0] = input sample(); //newest sample @ top of buffer 
for (i - N-1; i »- 0; i--)  //start 8 bottom to convolve 

1 
yn += (h[i] * dly[il):; //y-h[N-1]x[n- (N-1) ] 2. . . -h(O] x [n] 
divii] = dlyli-1]; //update sample data move "down" 
} 

#elif METHOD == e! //use xtra memory location 
dly[0] = input sample(): //newest sample @ top of buffer 
for (i = N-1; i»-0; i--) //start & bottom of buffer 

{ 
yn += (h[i] * dly[il): //yzhIN-I1]x[n- (N-1) ] *. . .«h I0] x[n] 
diy[i*1j] = dlyfil; //update sample data move "down" 
} 

#elif METHOD == ‘p’ /flst convoive before loop 
dly[N-1] = input sampie(); //newest sample @ bottom of buffer 
yn = h[N-1; * dly[0]; //ysh[N-1]x[n-(N-1)] (only one} 
for (i = 1; i«N; i++) //convolve the rest 


{ 
yn +5({h(N-(it+t)]*dly{i]}; //h[N-2]x(n-(N-2)]*. . .«h[0] x [n] 


dlyji-1] = dlylIil; //update sample data move *up" 
} 
#endif 
output sample(yn >> 15); //output filter 
return; //return from ISR 


} 


void main(} 
{ 


comm intrí); //init DSK, codec, McBSP 
while(1); //infinite loop 
} 


-一 一” 
图 4.25 使 用 4 种 方法 实现 卷 积 和 更 新 延迟 抽样 的 FIR 程序 ( FIR4ways.c ) 
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FER PEGE “TEP” Euh. WEE fle. RR Ae. AT 
说 明 第 三 种 方法 (方法 C)， 数 组 的 大小 现 设 为 N +1, TR: SAA ON Pee 
单元 保存 延 时 抽样 。 本 例 中 缓冲 区 的 底部 (末尾 ) 是 指 第 N 个 存储 单元 ， 而 不 是 第 N+ 1 个 。 注 
AX. 在 这 种 情况 下 ,通过 使 用 索引 变量 i < N, 第 N + 1 存储 单元 中 不 用 的 数据 x (n ND RET. 

第 二 种 方法 【方法 B) 使 用 单 循环 实现 着 积 和 更 新 抽样 ， 卷 积 开 始 用 最 早 的 数据 和 最 早 的 一 
个 系数 (按照 排列 廉 序 )， 抽 样 通过 缓冲 区 “向 上 ”移动 ， 利 用 下 面 公 式 进行 计算 ; 

y(n) = h(N — Dx(n - (N — 1)) + A(N - 2)x(n - (N - 2)) + + h(O)x(n) 

更 新 方法 类 似 于 第 一 种 方法 。 在 方法 B 中 ， 当 i = 0 时 , 最 新 的 抽样 被 位 于 抽样 缓冲 区 之 前 的 
存 赃 单元 的 无 效 数据 替换 ， 怕 该 无 效 数据 会 在 下 一 个 计算 y(n) 的 时 间 单 元 之 前 被 新 采集 的 输入 抽 
样 dlyf0] 所 蔡 换 。 也 就 是 说 ， 除 了 ; = 0， 对 证 所 有 i 值 都 可 以 用 一 个 让 语句 更 新 各 抽样 值 。 

第 三 种 方法 用 和 N+ 1 个 存储 单元 来 更 新 延 时 抽样 ， 第 入 + 1 个 存储 单元 中 的 未 被 使 用 的 数据 也 
被 更 新 ， 该 多 余 的 存储 单元 用 来 避免 该 单元 中 的 有 效 数据 被 覆盖 。 

第 四 种 方法 是 在 循环 外 计算 第 一 个 卷 积 表达 式 。 在 以 上 几 种 方法 中 ， 延 时 抽样 保存 在 存储 单 
元 中 ， 量 新 的 抽样 (保存 在 缓冲 区 的 开始 ， 而 最 早 的 抽样 xftr — (N — 切 ) 在 缓冲 区 尾部 。 但 是 ， 
在 这 种 方法 中 ， 基 新 输入 的 抽样 是 通过 dly[N-1] 得 到 的 ， 因此 ， 它 位 于 缓冲 区 的 尾部 ， 重 新 过 程 
将 数据 往 上 移动 。 

建立 并 运行 FIR4ways 工程 ， 检 验 输 出 是 否 是 中 心 频率 为 { kHz 的 FIR 带 通 滤波 器 ， 然 后 下 
依次 换 成 其 他 三 种 方法 ， 检 验 这 三 种 方法 并 观察 输出 结果 是 否 一 样 。 


$149 有 缚 用 滤波 和 调制 的 请 音 扰乱 器 

该 例 说 明了 语音 扰乱 / 解 拢 的 一 种 方法 ， 它 使 用 了 滤波 与 调制 的 基本 算法 。 在 例 2.14 中 已 介 
绍 过 调制 ， 其 中 语音 信号 为 输入 ， 输 出 为 扰乱 的 语音 信和 号。 当 一 个 DSK 信号 输入 到 运行 同样 程 
序 的 男 一 个 DSK 时 ， 扰 乱 的 语音 入 号 就 被 巾 复 成 原始 未 被 扰乱 的 语音 信号 。 

用 16 kHz 的 上 抽样 处 理 代替 AD535 编 解码 器 的 8 kHz 处 理 ， 性 能 会 更 好 ， 因 为 这 样 允 许 输 
人 信和 号 带宽 范围 更 宽 。 

扰乱 方法 通常 被 称 为 频率 倒置 ， 它 输 人 频率 为 0.3~3 kHz 的 音频 范围 信号 ， 将 其 调制 到 载波 
信和 号 上 。 频 率 倒置 是 通过 将 输 人 音频 信号 与 载波 相 乘 〈 调制 )， 使 其 频谱 产生 移动 并 生成 上 、 干 
边 带 ， 下 边 带 代表 可 昕 到 的 音频 部 分 ， 和 通过 这 种 方法 ， 原 来 低音 部 分 变 为 高 音 ， 反 过 来 也 一 样 。 

图 4.26 是 扰乱 方案 的 框图 ,在 A 点 是 0-3 kHz OASIS, EB 点 得 到 抑制 载波 的 双 
边 带 信号 ， 在 C 点 上 边 带 被 滤 掉 。 这 种 方法 的 优点 在 于 实现 简单 ， 只 用 到 简单 的 DSP WHE, we 
i. 正弦 产生 /调制 ，、 上 抽样 ( AD535 编 解码 器 的 抽样 速率 低 ) 





图 4.26 扰乱 方案 的 框图 
4.27 给 出 了 实现 该 方案 的 程序 Scrami6k.c， 输入 信和 号 先 通 过 一 个 低 和 通 滤波 器 ， 其 输出 CA 
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点 ) 与 3.3 kHz BESRSSASUEOR CUL )， 正 汞 数据 由 缓冲 区 中 获得 ，B 点 调制 的 信号 再 被 滤波 ， 


在 C 点 只 有 下 边 带 的 信和 号 。 


除了 main KRt, E 4.27 中 还 有 三 个 应 数 ， 其 中 filemodfilt 调用 了 第 一 个 低 通 滤波 器 ,实现 
SUBARU. (ORR YE FRA SES A. BART sinemod 用 3.3 kHz EKER 
fl (FOE) 已 滤波 的 信 壬 ， 产 生 上 、 下 边 带 信号 分 量 ， 调 制 后 的 输出 再 经 滤波 ， 这 时 只 有 下 按 带 


信号 分 量 被 保留 下 来 。 


上 抽样 获得 16 kHz 抽样 率 是 通过 对 数据 进行 两 次 处 理 , 但 只 保留 第 二 次 结果 来 实现 的 , 这 样 


可 以 扰乱 更 宽带 宽 的 输入 信号。 


低 遂 滤波 器 的 114 个 系数 保存 在 一 个 缓冲 区 中 , 系数 文件 p114.cof 在 辅助 材料 中 。 另 外 有 两 
个 缓冲 区 用 来 存储 延迟 的 抽样 值 ， 抽 样 值 在 存储 器 中 是 这 样 存放 的 : 


x(n — (N - 1), x(n - (N - 2), -.., x(n - 1), x(n) 


最 早 的 数据 在 缓冲 区 开始 ， 而 最 新 抽样 值 存在 缓冲 区 末尾 〈 底部 )。160 个 数据 共有 33 个 周期 ， 
保存 在 文件 smel60h 中 ( RHARD 生成 的 信 生 频率 为 


了 =Fx 周 期 数 /点 数 =16 000x33/160=3.3 kHz 


//8erami6k.c Voice scrambler/de-scrambier program 


#include "sinel60.h" 
#include *LP1l14.cof* 


short filtmodfilt (short data); 


//gine data values 
//filter coefficient file 


short filter(short inp,short *dly); 


short sinemod(short input); 


static short filterl[N],flter2[N]; 


short input, output; 


void maini) 


short i; 


comm pollí(); 
for (iz0; i« N; i++} 


t 
Blterl[i] = 0; 
fil&er2[i] = 0; 
) 
while(1) 
{ 


input-input sample(); 
filtmodfilt (input); 
outputsfiltmodfilt (input); 
output, sample (output); 


) 


short filtmodfilt (short data) 
{ 

data = filter(data,filteri); 
data = sinemod(data); 

data = filter (data,filter2); 
return data; 


short filter(short inp, short 
i 


short i; 
int yn; 


*dly) 


//init DSK using polling 


//init Ist filter buffer 
//init 2nd filter buffer 


//input new sample data 
//process sample twice (upsample) 
//and throw away ist result 
//then output 


//filtering & modulating 
//newest in --1st filter 


//modulate with ist filter out 
//2nd LP filter 


//implements FIR 
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Giy[N-1] = inp; . E //newest sample Gbottom buffer 

yn = dly[0] * h[N-1]; //y (0) zx(n- (N-1) )*h(N-1) 

for (i = 1; i < N; i++) //loop for the rest 
1 
yn *- dly[i] * h[N-(i*1)]; //yin) -x[n-(N-1-i)]*h(N-1-i] 
dlyIi-1] = dly[i]: //data up to update delays 
} 

yn = ((yn) »»15); //filter's output 

return yn; //return y(n) at time n 

} 

short sinemodíshort input) //sine generation/modulation 


static short iz0; 

input-(input*sineiSQ[i--])2»1i1; //(inputh*(sine data) 
if({i>= NSINE) i = 0; //if end of sine table 
return input; //return modulated signal 





图 4.27 语音 扰乱 程序 (Scramt6k.c ) 


将 第 一 个 DSK 的 最 后 输出 当做 另 一 个 运行 同样 算法 的 DSK 的 输入 ， 第 二 个 DSK 的 输出 就 
是 原始 未 扰乱 的 语音 信号 。 注 意 ， 当 并 口 电缆 (DB25 ) 断 开 时 ， 第 一 个 DSK 的 程序 仍 在 运行 。 

建立 并 运行 工程 Scraml6k, 先 输 人 2 kHz EAA, 测试 输出 是 13 kHz 的 下 边 带 信号 (3.3 kHz- 
2 kHz )， 上 边 带 信号 (3.3 kHz +2kHz ) 被 第 一 级 低 通 波 波 器 滤 掉 了 。 

第 二 个 DSK 用 来 恢复 / 解 扰 原 始 信号 〈 模拟 接收 机 )， 将 第 一 个 DSK 的 输出 作为 第 二 个 DSK 
的 输入， 并 运行 同样 程序 。 这 是 第 一 个 DSK 药 闭 过 程 ， 得 到 原始 未 扰乱 的 信号 。 沙 使 用 2 kHz 
的 信号 作为 输入 ,那么 第 二 个 DSK 的 输入 就 是 1.3 kHz 的 扰乱 信和 号， 最 后 输出 是 2kHz (33kHz- 
1.3 kHz ) 的 原始 信号， 也 就 是 下 边 带 信和 号 。 

如 果 输 入 是 频率 递增 的 正弦 扫 频 信号 ， 则 输出 为 频率 递减 的 扫 频 信和 导 ， 用 文件 TheForce.wav 
作为 输入 ， 检 验 扰乱 和 解 扰 方 法 的 正确 性 。 

通过 动态 改变 调制 频率 或 按照 预先 规定 的 序列 加 人 【或 去 掉 ) 载波 频率 ， 可 使 语音 信号 更 难 
被 截获 。 例 如 ， 第 一 个 码 不 进行 调制 ， 第 二 个 调制 在 频率 六， 第 三 个 则 调制 在 频率 f。 

该 工程 最 先 在 TMS320C25 扩 实现 ， 在 TMS320C31 DSK 上 无 需 上 抽样 也 实现 了 该 工程 。 


例 4.10 下 抽样 的 混 生 效应 的 演示 

图 428 给 出 了 实现 该 工程 的 程序 aliasing.c。 为 了 说 明 混 秋 效应 ， 将 处 理 速率 降低 一 半 ， 等 效 
T 4kHz 的 速率 . 注意 在 AD535 编 解码 器 上 , 抗 混 从 和 重 构 波 波 器 是 国定 的 , REESE, 
用 上 抽样 和 低 通 滤波 器 将 速率 为 kHz 的 抽样 送 到 抽样 速率 为 8 kHz 的 AD535 编 解 码 器 。 

建立 工程 文件 aliasing， 读 人 配置 选择 文件 aliasing.gel ( 在 辅助 材料 中 )}， 程 序 中 将 抗 混 秋 初 
始 值 设 为 0， 因此 将 产生 混 雪 现象 。 


1， 输 人 正弦 信 导 ， 检 验 当 输 人 信号 频率 达到 2 kHz 时 ， 由 于 没有 频率 混交 效应 ， 输 出 基本 上 
是 一 个 延迟 程序 (将 给 入 延迟 ), 当 输入 信号 频率 增加 到 2.5 kHz 时 ,检验 输出 是 一 个 1.5 kHz 
的 混 全 信和 号。 同样 ，3 kHz 和 3.5 kHz 的 输入 信号 将 分 别 产生 1 kHz 和 0.5 KHz 的 混 全 信和 号 输 
出 。 由 于 AD535 编 解码 器 上 抗 温 符 涉 波 器 的 作用 ， 频 率 高 于 3.5 kHz 的 输 人 信和 号 被 抑制 了 。 
2， 把 滑动 条 改 在 位 置 1， 则 在 4 kHz 下 抽样 时 ， 需 要 抗 混 王 滤波 器 。 当 输 人 频率 达到 1.8 kHz 
时 ， 输 出 是 输入 的 延迟 。 但 当 输入 信和 号 频率 超过 1.8 kHz 时 ， 可 看 到 输出 衰减 至 0， 这 是 因 
AUS 18 kHz 抗 泥 登 低 通 滤波 器 的 影响 ， 它 是 由 系数 文件 lp33.cof 实现 的 ( 在 辅助 材料 中 ) 
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另外 ， 也 可 用 Goldwave 软件 播放 sweep.wav 文件 ， 代 替 正 东信 和 号 作为 输 人 进行 实验 (参见 


附录 E )o 


f/Miiasing.c illustration of downsampling, aliasing, upsampling 


#include "1p33.cof" 
short flag = 0; 

float indly[N], outdlyin]; 
short i; 

float yn; 

short antialiasing = 0; 


interrupt void c int11!) 
{ 


indly(0]= (float) (input, sample(]); 


yn = 0.0; 
if (flag == 0} 
flag = i; 
else 
i 
if (antialiasing -- 1) 
i 
for {i = 0 ; i < N ; i++) 
. yn += (hli]*indly[i]); 
} 
else 
yn = indly[0]; 
flag = 0; 
} 
for {i = N-1; i > 0; i--) 
indiy[i] = indlyji-1]; 
outdly[0] = {yn}; 
yn = 0.0; 
for {i = 0; i < WN; i++) 
yn += (h[i]*outàly[i]); 


for (i = N-1; i > 0; i--} 
outdly[i] = outdlyl[i-i]; 


cutput sample ( (short) (yn)); 
return; 


void maini) 

t 
comm intrí): 
whiletl); 


} 
—M————————————————————— O 


//lowpass at 1.8 kHz 

/ftoggles for 2x down-sampling 
//antialias and reconst delay lines 
/f/index 

//fBlter output 

//init for no antialiasing filter 


//ISR 


//new sample to antialias filter 
//initialize downsampled value 
//discard input sample value 
//don't discard at next sampling 


//if antialiasing filter desired 
//compute downsampled value 
//using LP 8 1,8 kHz filter coeffs 
//füilter is implemented using float 


//if filter is bypassed 
//downsampled value is input value 
//next input value will be discarded 


//update input buffer 
//input to reconst filter 
//4 KHz sample values and zeros 


//are filtered at 8 kHz rate 
//by reconstruction lowpass filter 


//update delays 


//8 kHz rate sample 
//return from interrupt 


//init DSK, codec, McBSP 
//infinite loop 


图 4.28 演示 4 kHz 下 抽样 时 混合 与 抗 泥 生 特性 的 程序 (aliasing.c ) 
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4.11 X FIR 滤波 器 的 实现 
图 4.29 给 出 了 逆 FIR WERE BE FiRinverse.c, FIR 滤波 器 的 原始 输 和 人 序列 可 以 用 逆 FIR 
滤波 器 恢复 ,六 阶 的 FIR 滤波 器 的 传输 函数 是 ， 





HO Y Ar 


i= 


HE, AARP RO RAR. FIR 滤波 器 的 输出 序列 为 : 
y(n) = Y hain-à = hyx(n)+ hix(n-1)4 hy ax(n-(N -1) 
i-ü 


其 中 x(n — DRAMA. Hit EA) ME THB,: Ifi A FRAU RE RET LASER the 


ims 


NA 
yn) - F h&(n - i) 


hy 


/J//TIRinverse.c Implementation of inverse FIR Filter 


Kinclude "bp4l.co£f"* 
int yn; 
short dliy[Nl; 


int out type = i; 

interrupt void c. intli() 

{ 

short i; 

djy[0] = input_sample({); 

yn = 0; 

for (i = 0; i«N; i++) 
yn += (h[il*dly[il); 


if (out_type==1} 
output, sample (diy[0]); 
if(out, type-z2) 
output, sample (yn»»15); 
if (out_type==3) 
{ 


for {i = N-1; i»1; i--) 
yn -= (h[i)*dly[il); 
yn = yn/h[0]; 


output sample (yn»»-8B); 
j . 
N-1; i»0; i--} 


for (i - 
aly[il = dlylii-1]; 
return; 


} 


void main() 
{ 


//coeffcient file BP B Fs/8 
//filter's output 

//delay samples 

//output type for slider 


//18R 


//newest input sample data 
//initialize filter's output 


/fyin)*-h(i)*x(n-i) 
/fif slider in position 1 
//original input 


//output of FIR filter 
//calculate inverse FIR 


//calculate inverse FIR filter 
//8Cale output of inverse filter 
//send output of inverse filter 


//from bottom of buffer 
//update delay samples 
//return from ISR 
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comm intrí); //init DSK, codec, McBSP 
while({1); //infinite loop 
} 





图 4.29 hy ARSC BEE ( FIRinverse.c ) 

建立 工程 FIRinverse， 用 噪声 做 输 人 【由 Goldwave 软件 或 者 噪声 发 生 器 产生 ， 或 修改 程序 ， 
使 用 伪 随 机 噪声 序列 等 ) 当 滑 动 条 选择 在 位 置 1 ( 默认 位 置 ) 时 , 检验 输出 是 否 是 输入 的 噪声 序 
列 ; 将 滑动 条 选择 在 位 置 2 时 ， 检 验 中 心 频率 为 1 kHz 的 FIR 带 通 滤波 器 的 输出 ， 当 将 滑动 条 选 
择 在 位 置 3 时 ， 这 时 进行 FIR 滤波 器 逆 过 程 的 计算 ， 这 样 ， 最 后 得 到 原始 输入 阳 声 序列 。 

$1412 ”调用 汇编 函数 的 C 诺言 实现 FIR 

该 例 介绍 使 用 C BEF FiRcasm.c ( 如 图 4.30 ) 调用 汇编 函数 FIRcasmfunc.asm ( 如 图 4.31) X 
H FIR WERDE. 


//TIRCASM.c FIR C program calling ASM function fircasmfunc.asm 


finclude "bp4l.cof" //BP @ Fs/8 coefficient file 
int yn = (0; //initialize filter's output 
short dlyi[N]: /fdelay samples 
interrupt void c intil() //ISR 
{ 
dly[N-1] = input_sample(); //newest sample @bottom buffer 
yn = fircasmfunc(dly,h,N); /fto ASM func through A4,B4,A6 
output sample(yn >> 15); //filter's output 
return: //return from ISR 


) 


void main() 
( 


short i; 

for (i = 0; i«N; i++) 

dly[i] = 0; //init buffer for delays 
comm intrí():; //init DSK, codec, McBSP 
whileil); //infinite loop 





图 4.30 调用 汇编 函数 实现 FIR 的 C 程序 (FIRcasm.c ) 


建立 并 运行 工程 FIRcasm, 检验 输出 是 1 kHz 的 FIR 带 通 滤波 器 。 建 立 两 个 缓冲 区 ， dly 存放 
抽样 数据 ，A 存放 滤波 器 系数 。 当 每 一 次 中 断 发 生 时 ， 就 会 采集 到 一 个 新 的 数据 ， 并 将 其 存放 到 
缓冲 区 diy 的 未 尾 ( 高 地 址 存储 器 ), 表 4.3 列 出 了 抽样 数据 与 滤波 器 系数 在 存储 器 中 的 排列 方法 ， 
即 最 早 的 抽样 数据 在 丢 冲 区 的 开始 ， 最 新 数据 在 缓冲 区 未 尾 。 系 数 排列 的 顺序 是 RDO) 在 缓冲 区 的 
开始 ，h(N - 1 在 缓冲 区 末尾 。 

抽样 数据 缓 神 区、 滤波 器 系数 缓冲 区 的 地 址 及 缓 训 区 的 大 小 分 别 通过 寄存 器 A4. B4 和 AG 
传 给 汇编 函数 ， 因 为 每 个 存储 单元 中 数据 是 按 字 节 存放 的 ， 通 过 寄存 器 AG 传送 的 缓冲 区 大 小 都 
增加 了 一 倍 。 指 针 A4 和 BA 按 两 字 节 ( 两 个 存储 单元 ) 增 1 或 减 1. 系数 缓冲 区 的 末尾 地 址 存放 
在 寄存 器 B4 P, REHN ~ 1。 
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34.3 程序 FIRcasm 中 滤波 器 系数 和 抽样 数据 在 存储器 中 的 组 织 方式 





抽 # 
系数 i n tf n+1 hl 
hid) A4—x(n- (N-1)} Axin- (N= 2)) 
Aí(1) x(in-— iN—2)) xin-(N—3)) 
h(2) xin—-(N-3)) x(n—- (N—4)) 
h(N- 2) x(n- 1) x(n- 1) 
BA-—h(N-1) x(n) 个 最 新 数据 一 x(n) 


两 条 LDH 指令 读 取 寄存 器 A4 和 BA 中 存储 的 地 址 所 指 的 存储 单元 的 内 容 ， 分 别 取出 最 早 的 
抽样 x(n — (N - 1)) 和 h(N - 1)， 然 后 A4 再 递减 指向 x(n - (N - 2))，B4 递减 指向 A(N -2)。 第 
一 次 累加 运算 后 ,最早 抽样 值 被 更 新 。 寄 存 苦 AA 指定 的 单元 内 容 被 传送 到 AT, 然后 再 保存 在 前 
面 的 存储 单元 中 ， 这 是 因为 A4 的 值 虽 减 小 ， 但 并 没有 改变 指向 保存 最 早 抽样 值 的 存 依 单元， 因 
此 最 早 抽样 信 zxt* — (N — 1) 被 x(n - (N - 2)) 替 代 (更 新 ) 抽样 值 的 更 新 是 为 下 一 个 时 间 单 元 
做 准备 的 。 当 正在 计算 ”时刻 输出 时 ， 抽 样 值 就 为 上 + 1 时 刻 做 准备 。n 时 刻 滤波 器 的 输出 为 ; 

y(n) = ACN - 1)x(n -(N - 1) + AWN - 2)xx(n - (N - 2) 9-4 
Ah(1)x(n — 1) + h(Q)x(n) 


PFIRCASHfunc.agsm ASM function called from C to implement FIR 
:hd = Samples address, B4 = coeff address, AG = filter order 
Delays organized as:x(n-(N+1})...x(n);ceeff as h[0]...h[N-1] 


„def -hrcasmfunc 


_fircasmfunc: 7ASM function called from C 
MV A6,AL ;setup loop count 
MPY A6,2,À6 ;since dly buffer data as byte 
ZERO Ag ;init AB for accumulation 
ADD A6,B4,B4 isince coeff buffer data as byte 
SUB B4,1,B4 ;B4á-bottom coeff array h[N-1] 
loop: ;Start of FIR loop 

LDH *Ad++,B2 fAQ=x[n-(N-L}+i] i20,1,...,N-1 
LDH *B4--,B2 :B2-h[N-1-i] i-0,1,...,N-1 
NOP 4 
MPY A2,82,A6 ;A6-x[n- (N-1) 41] *h[N-1-i] 
NOP 
ADD Ab5,AB,AB8 ;&ccumlate in A& 
LDH *A4,A7 ;PAT-x[(n-(N-1)*i-1]update delays 
NOP 4 fusing data move "up" 
STH A7,*-A4f11] ;--»X[ín-(N-1)4i] update sample 
SUB A1,1,A1 ;decrement loop count 

[A1] B loop ;branch to loop if count # 0 
NOP 5 
MV AB,A4 ;result returned ihn A4 
B B3 : ireturn addr to calling routine 


图 431 C 调用 的 FIR 汇编 函数 《FIRcasmfunc.asm ) 
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循环 进行 41 次 ， 恢 次 计算 出 时 刻 n, ne 1 和 nn +2 时 的 输出 值 ， 并 为 下 一 时 间 单 元 更 新 抽样 
值 。 最 新 的 抽样 值 在 此 过 程 中 也 被 蔡 换 ， 无效 数据 驻 留 在 缓冲 区 尾部 后 的 存储 单元 ， 不 过 在 每 个 
时 间 单 元 ， 编 解码 器 上 的 ADC 获得 的 最 新 抽样 值 会 将 它 覆 盖 挤 ， 从 而 弥补 上 述 问题 。 

在 寄存 器 AB 中 进行 累加 ， 每 个 时 间 单 元 得 到 的 结果 被 送 到 寄存 器 A4， 再 返回 给 调用 函数 ， 
调用 函数 的 地 址 在 寄存 器 B3 中 。 


观察 存 铺 器 中 的 抽样 值 更 新 情况 

1. 选择 菜单 Select—View 一 Memory， 使 用 16 位 十 六 进 制 数据 格式 ， 起 始 地 址 为 dly， 各 时 
刻 抽 样 值 以 字 节 形式 保存 在 82 个 (而 不 是 41 个 } 存储 单元 中 。 渡 波 器 系数 保存 在 缓冲 
区 中 ， 也 占用 82 个 存储 单元 。 检 验 以 16 位 或 半 个 字形 式 保 存在 系数 缓冲 区 中 的 系数 ， 
点 击 右键 Memory 窗口 , 取消 选择 “Float in Main Window” 选 项 , 这 时 可 更 好 地 观察 源 程序 
和 存储 器 的 内 容 。 

2. 选择 菜单 Select ViewMixed C/ASM, 在 函数 FIRcasmfunc.asm 内 下 面 的 指令 行 设置 断 点 : 


MV A8, Ad 


也 可 以 在 该 指令 行 双击 或 用 右键 点 击 设置 晰 点 。 

3. AFRA SelectDebug— Animate (第 1 章 已 介绍 过 )， 每 个 时 间 单 元 可 序 执行 到 断 点 处 
停止 , 这 时 观察 抽样 缓冲 区 最 下 面 存 储 单元 , 检验 在 缓冲 区 未 尾 的 最 新 抽样 数据 ,该 数据 
然后 会 向 缓冲 区 上 面 移动 。 观 察 一 段 时 间 抽 样 值 的 更 新 情况 , 即 存储 器 缓冲 区 中 的 每 个 数 
据 向 上 移动 ， 同 时 可 以 观察 到 寄存 器 A4 (指针 ) 按 2 递增 {两 个 字 节 ) 和 B4 按 2 递减 。 


例 4.13 调用 快速 汇编 函数 的 C 语言 实现 FIR 

该 例 与 例 4.12 中 使 用 相同 的 C 调用 函数 (FIRcasm.c ), 它 调用 在 文件 FIRcasmfuncfast ( 而 不 
是 FIRcasmfunc ) 内 的 汇编 函数 Fircasmfunc.asm ( 如 图 4.32 所 示 Y, 

该 函数 使 用 了 并 行 指令 ， 并 对 指令 进行 了 重新 组 织 , 因此 比例 4.12 中 的 函数 执行 速度 快 。 该 
KRAH T ARH AES: LDH/LDH 和 SUBALDH。 


1. NOP 指令 由 19 个 减 到 11 个 。 
2. 将 使 循环 计数 减 小 的 SUB 指令 秘 到 程序 上 方 。 
3. 改变 了 一 些 推 邻 的 次 序 ,“ 填 补 ” 一 些 NOP 指令 的 时 隙 。 


例如 , 因为 转移 指令 有 5 个 延迟 时 隙 ,所 以 加 法 指令 ADD 在 A8 累加 执行 后 ,执行 条 件 分 支 
指令 。 直 于 对 指令 进行 进一步 排序 ,一 些 附加 的 变动 将 加 快 程序 的 运行 速度 ， 但 同时 程序 也 将 恋 
得 不 容易 理解 了 。 

建立 工程 FIRcasmfast, 连接 器 将 执行 名 为 FIRcasmfast.out 的 可 执行 文件 , 输出 结果 是 例 4.12 
中 的 1 kHz 带 通 滤 波 器 。 


例 4.14 用 忆 语 音调 用 汇编 函数 并 使 用 循环 缓冲 区 实现 FIR. 

C 程序 FiReirc.c ( 如 图 4.33 所 示 ) 调用 了 汇编 函数 FIRcircfunc.asm ( 如 图 4.34 所 示 )， 并 利用 
循环 缓冲 区 来 实现 FIR 滤波 器 ， 该 例 扩 展 了 例 4.13。 文 件 bp1750,cof 中 的 系数 是 利用 MATLAB 设 
计 的 , 窗 函 数 是 凯 塞 窗 , 文件 内 有 128 个 系数 , 表示 中 心 频率 为 1750 Hz 的 FIR 带 通 滤波 器 ,图 4.35 
显示 了 滤波 器 的 特 件 ， 该 滤波 器 是 用 MATLAB 的 滤波 器 设计 工具 SPTOOL 实现 的 《 见 附录 D), 
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SFIRCASMfuncfast.asm C-called 
-def _fircasmfunc 
.fürcasmfunc: 
MV A6,Al 
MPY AG, 2,A6 
ZERO A8 
ADD A6,B4,BÀ 
SUB B4,1,B4 
loop: 
LDH *Ad++, A2 
H LDH *Bá--,B2 
SUB A1,1,A1 
E LDH *Ad,A7 
NOP 4 
STH AT, *-A4[1] 
[A1] B loop 
NOP 2 
MPY A2,B2,AÀ6 
NOP 
ADD A6,AB,AS 
B B3 
MV A8,A4 
NOP 4 


faster function to implement FIR 


;ASM function called from C 
;setup loop count 

;Since diy buffer data as byte 
;init A8 for accumulation 

;since coeff buffer data as byte 
;Bésbottom coeff array h[N-1] 
;Start of FIR loop 
1A2-x[n-(N-1)4i] i=0,1,... 
;B2=h[N-1-i] i-0,1,...,N-1 


,N-1 


- decrement loop count 


;A7-x[(n-(N-1)«i-1]update delays 


;--X[(n-(N-1)4i] update sample 
;branch to loop if count # 0 


; A6zx[n-(N-1)4i]*h[N-1-i] 
;accumlate in A8 


¡return addr to calling routine 
result returned in A4 





图 4.32 具有 较 快 执行 速度 的 C RFID ANREDE ( FER casmfuncfast.asm ) 


//FIRcirc.c C program calling ASM function using circular buffer 


finclude "bp1750.cof* 
int yn - 0; 


interrupt void c intil() 
{ 

short sample data; 
sample data = input, sample(); 
yn = 
output sample([yn >> 15); 
return; 


) 


void main({) 
{ 
comm_intr (); 
whiletl): 

} 


fircircfuncí(sample data,h,N); 


//BP at 1750 Hz coeff file 
//init filter’s output 


//ISR 


//newest input sample data 
//ASM func passing to A4,B4,A6 
//filter’s output 

//return to calling function 


//init DSK, codec, 
//infinite loop 


McBSP 





FA 4.33 | DAC A A Fe OC RE ( FiRcirc.c ) 
为 了 代替 移 动 数据 更 新 延迟 的 抽样 ， 例 中 使 用 了 数据 指针 。 地 址 模式 寄存 器 ( AMR ) 的 最 低 


15 位 设置 为 : 
0x0040 = 


0000 0000 0100 0000. 


本 例 把 寄存 器 AT 的 模式 设置 为 循环 缓冲 区 指针 寄存 器 。AMR 的 高 16 位 通过 N = 0x0007 设 
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置 ， 将 块 BKO 作为 播 环 缓冲 区 。 缓 冲 区 的 大 小 是 2w1= 256。 本 例 中 循环 缓冲 区 只 用 于 存放 延迟 
抽样 数据 。 也 可 从 使 用 第 二 个 循环 缓冲 区 来 存放 滤波 器 系数 。 鲍 如 使 用 ， 


0x0140 = 
将 选择 B4 和 A7 两 个 指针 。 


0000 0001 0100 0000 


IFIRCircfunc.asm ASM function called from C using circular addressing 


;Ad=newest sample, 


Bé=coefficient address, 


AG6=filter order 


Delay samples organized: x[n-(N-1)]...xín]; coeff as h(0)...h(N-1] 
.üef _fircircfune 
.def last_addr 
.def delays 
.sect "circdata" rcircular data section 
.align 256 align delay buffer 256-byte boundary 
delays -Space 256 ;init 256-byte buffer with O's 
last addr  .int last Aaddr-1 iPoint to bottom of delays buffer 
.text :COde section : 
.fixcircfunc: ;FIR function using circ addr 
MV AG, AL isetup loop count 
MPY A5,2,A6 :Since dly buffer data as byte 
ZERO Aŝ ;init AB for accumulation 
ADD A6, B4, B4 ;Since coeff buffer data as bytes 
SUB B4,1,B4 :Bd=bottom coeff array h[N-1] 
MVKL 0x00070040,B6 ;select A7 as pointer and BKO 
MVKH — 0x00070040,B5 ;BKO for 256 bytes (128 shorts) 
MVC B6,AMR rset address mode register AMR 
MVK last addr,A9 ;A9=last circ addr(lower 16 bits) 
MVKH — last addr,A9 ;last circ addr (higher 15 bits) 
LDW *A9,A7 PA7-last circ addr ` 
NOP 4 
STH Ad, *AT++ ;newest sample-->last address 
loop: ;begin FIR loop 
LDH *A7++,A2 ;A22x[n-(N-1)«i] iz0,1,...,N-1 
B LDH *Bá--,B2 ;B2-2h[N-1-i] i20,1,...,N-1 
SUB Al,1,Al ;decrement count 
[Al] B loop ;branch to loop if count # 0 
NOP 2 
MPY A2.B2,A6 ;A6-x[n- (N-1) £i] *h[N-1-4i] 
NOP 
ADD A6,AD,AB accumulate in AS 
STW A7,*AS istore last circ addr to last, addr 
B B3 ;return addr to calling routine 
MV AS, Ad ;result returned in A4 


NOP 4 
一 


图 434 使 用 循环 缓冲 区 更 新 抽样 的 C 调用 汇编 函数 ( FIRcircfunc.asm ) 
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435 用 MATLAB 滤波 器 设计 工具 SPTOOL 设计 的 中 心 频率 为 
1750 Hz， 包 含 128 个 系数 的 FIR 带 通 滤波 器 的 频率 特性 图 


在 C 程序 中 ， 程 序 行 里 的 汇编 指令 可 和 asm 语句 一 起 使 用 ， 例 如 : 

asm(" MVK 0x0040,B6”) 
注意 在 第 一 个 引号 后 有 空格 ， 指 令 并 不 是 从 第 一 列 开始 的 。 循 环 寻 址 模式 避免 了 数据 移动 来 更 新 
抽样 值 ， 因 为 使 用 指针 移动 可 实现 同样 的 较 高 运行 速度 。 

寄存 器 指针 A7 最 初 指向 抽样 缓冲 区 的 最 后 一 个 地 址 单元 ， 暂 时 只 考虑 抽样 缓冲 区 ， 因 为 它 
是 循环 的 。 

1. nid. Æ n 时 刻 ，A7 指向 缓冲 区 末尾 ， 即 最 新 抽样 值 的 存储 单元 ， 然 后 指针 逐步 指向 

缓冲 区 开始 ， 如 表 4.4 所 示 ， 接 着 执行 程序 的 循环 部 分 ， 并 计算 : 
y(n)=h(N—1)x(n—(N—1)+h(N—2)x(n—(N—2))+..: 
+ h(1)x(n - 1) - A(0)x(n) 

计算 完 最 后 一 项 乘积 h(0)x(n) 后 ，A7 再 增加 并 指向 缓冲 区 开始 的 存储 单元 ，n 时 刻 滤波 器 的 

输出 结果 返回 给 调用 函数 。 在 每 个 时 间 单 元 循环 开始 执行 前 ， 寄 存 器 A7 作为 指针 始终 指向 

最 新 抽样 的 存储 单元 。 在 每 个 时 刻 n, n +1, n+2,… 新 的 抽样 值 通过 A4 传 给 汇编 函数 , 而 A4 

保存 在 A7 中 ，A7 总 是 指向 最 后 一 个 地 址 单元 。 


R44 使 用 循环 缓冲 存储 器 的 系数 和 抽样 的 内 存 组 织 








io 样 
系数 n 时 刻 n+1 时刻 n+2 时 刻 
h(0) A7 ox(n- (N-1)) 最 新 -x(n+1) 最 新 = x(n+1) 
h(1) x(n- (N- 1)) A7 >x(n- (N-2)) AT 一 x(tn+2) 
h(2) x(n- (N-1)) x(n- (N-3)) 2xí(n- (N-3)) 
h(N- 2) x(n-1)) x(n- 1) x(n-1) 


h(N-1) 最 新 一 x(n) x(n) x(n) 
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2. n 1 时 刻 。 在 r+ 1 时 刻 ， 最 新 抽样 x(n + 1) 通 过 A4 传递 给 汇编 函数 ，STH 指令 将 该 抽样 
值 保存 到 AT 所 指向 的 缓冲 存储 单元 ，A7 现在 是 指向 缓冲 区 的 开始 单元 ， 然 后 指针 A7 增 
加 ， 指 向 存储 xfta — (N — 2) 的 地 址 单元 ， 如 表 4.4 所 示 ， 这 时 输出 为 : 

y(n +1) = AN = Dx(n - (N - 2) - ALN - 2)x(n - (N — 3) 9 -- 

.+ h(DxG + h(0)x(n + 1) 
最 后 一 项 蒋 积 始终 是 产 (0) 和 最 新 抽样 的 乘积 。 
3. 闫 +2 时 刻 。 在 m+2 时 刻 ， 滤 波 器 输出 为 : 
y(n*2)- RN ~ )x(n - (N - 3) + (N -2)x(n -(N - 4)+... 
l + h(Dx(n + 1) + h(Q)x(n +2) 

HE. ASSAM, BE SIO ARRA, Enn A, da 
汇编 函数 计算 出 证 波 器 的 输出 ， 然 后 再 将 结果 送 到 C 调用 函数 ， 这 里 ， 每 个 抽样 周期 会 
得 到 一 个 新 抽样 。 


像 例 4.13 一 样 ， 条 件 转移 指令 移动 到 了 上 面 。 当 AS 中 的 累加 指令 ADD 完成 后 ， 开 始 运行 
指 癌 循环 的 分 支 指令 ( 因为 该 指令 有 S MERR o 在 处理 到 -一 个 缓冲 区 末 是 时 , 可 以 先 将 AMR 
的 内 容 保存 起 来 , 在 使 用 它 之 前 ,再 用 一 对 含有 寄存 器 了 的 MVC 指令 ; MVC AMR, Bx fl MVC 
Bx, AMR 把 AMR 的 内 容 恢复 出 来 。 

建立 并 运行 工程 FIRcire,. 检验 中 心 频率 为 1750 Hz 的 FIR 带 通 滤波 器 。 再 停止 运行 程序 , 复 
位 、 重 新 装载 程序 。 

HEILAR AZ FiRcirefunc.asm 内 分 支 指令 返回 C 调用 阔 数 时 设置 断 点 , 观察 delays 地 址 的 存储 
单元 ,检验 大 小 为 256 的 缓冲 区 初始 化 时 为 0。 为 了 更 好 地 观察 屏幕 结果 ， 点 击 右边 Memory B 
口 , 取消 “Float in Main Window", 运行 程序 , 执行 到 断 点 后 停止 , 检验 是 否 保 存在 缓冲 区 ( 0x3FE 
及 (0x3FF ) 最 后 ( 高 地 址 ) 的 最 新 ( 16 位 ) 抽 样 值 ,存储 单元 0x400 中 包含 最 后 一 个 单元 地 址 0x301, 
该 单元 用 来 存储 下 一 个 抽样 ， 该 地 址 是 缓冲 区 的 开始 。 观 察 核 心 寄 存 器 并 检验 AT 中 包含 的 地 址 。 

再 运行 程序 并 观察 保存 在 缓冲 区 开始 的 新 抽样 ， 注 意 A7 增加 到 了 0x303, 0x305, … 更 新 抽样 
的 方法 是 很 有 效 的 。 注 意 缓冲 区 大 小 是 以 2 的 指数 为 单位 的 ， 这 一 点 很 重要 。 


例 4.15 用 外 部 存储 器 中 的 循环 缓冲 区 ， 用 C 语言 调用 汇编 函数 实现 FIR 

该 例 用 外 部 存储 器 作为 循环 缓冲 区 来 实现 FIR DEE, EG 4.14 稍微 进行 了 扩展 。 将 
例 4.14 中 的 已 程序 FIReirc.e 进行 修改 , 得 到 FIReire_extc ( 如 图 4.36 所 示 )， 从 而 使 它 调用 汇编 
函数 FIRcircfunc extasm ( 代替 FIRcircfunc.asm， 如 图 4.37 FAR). 


SESE 
//FIRCirc ext.c C program calling ASM function using circular buffer 


#include “bp1750.cof* //BP at 1750 Hz coeff file 
int yn - 0; //init filter's output 
interrupt void c_int11() //ISR 


1 
Short sample data; 
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sample data = input sample(): //newest input sample data 
yn = fircircfunc, ext(sample data,h,N); //ASM funcn passing to A4,B4,A6 
output sample(yn >> 15}; filter's output 


return; //return to calling function 


} 


void main() 


{ . . 
comm intrí);:; //init DSK, codec, McBSP 


while(1); /finfinite loop 
} 





图 436 使 用 外 部 存储 器 作为 循环 缓冲 区 ， 调 用 汇编 函数 的 己 程 序 CFIRcirc ext.c) 





;PFIRcircfunc azt.aga Function using circular buffer in external memory 
;AÁ-newest sample, Bd=coefficient address, Aé=filter order 
:Delay samples organized: x[n-(N-1)]...x[n}; coeff as h(0)...h[N-1] 


. def Hrcircfunc ext 
def last_addr 
def. delays 


-Sect "circdataà" circular data section 
.align 256 Align delay buffer 256-byte boundary 
delays .Space 256 rinit 256-byte buffer with 0's 
last addr  .int last, addr-1 
„text code section 
_fircircfunc_ext: #FIR function using circ addr 
MV A6,Al :setup loop count 
MPY A6,2,A6 :aince dly buffer data as byte 
ZERO AB rinit A8 for accumulation 
ADD A6, B4, Bå ince coeff buffer data as bytes 
SUB B4,i,B4 ;Bá-bottom coeff array h(N-1] 


MVEL 0x00070040,B6 ;select A7 as pointer and BKO 
MVEH — 0x00070040,B6 ;BKO for 256 bytes (128 shorts) 
MVC B6, AMR ;Set address mode register AMR 


MVEL last addr,A9  ;A9-bottom circ addr in external mem 
MVKH last addr,A9 ; (higher 16 bits)in external circ 


LDW *A9,AT7 PA7-last circ addr 
NOP 4 l 
STH Ad, *A7 +4 ;newest sample-->last address 
loop: ;begin FIR loop 
LDH *AT+4+,A2 PAZ-x[n-(N-1)*4i] i-0,1, i, N-1 
i LDH *Bá--,B2 #B2=h(N-1-i} i-0,1,...,N-1 
SUB A1,1,A1 decrement count 
[A1] B loop ;branch to loop if count # 0 
NOP 2 


MPY A2,B2,46 ; Aézx[n- (N-1)4i] *h(N-i+i] 
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NOP 

ADD A6,A8,A8 accumulate in A8 

STW AT, *A9 ;8tore last circ addr to last_addr 
B B3 ;return addr to calling routine 
MV AB, Ad result returned in A4 

NOP 4 





437 ”使 用 外 部 存储 器 作为 循环 缓冲 区 ，C 调用 的 汇编 函数 程序 ( FIRcircfunc. extasm) 


例 中 使 用 的 连接 命令 文件 FIRcire_extcmd 如 图 4.38 所 示 ， 其 中 circdata 段 指定 的 存储 区 是 
buffer_ext， 在 外 部 存 屠 器 中 的 起 始 地 址 是 0x80000000。 





/*FIRcirc ext.cmd Linker file for circular buffer in external memory*/ 


MEMORY 
{ 
VECS: org = Oh, ien = 0x220 
IRAM: org = 0x00000220, len = 0x0000FDCÓ 
buffer ext: org = 0x80000000. len = 0x00000110 
SDRAM: org = 6x80000116, len = Ox01000000 
FLASH: org = 0x90000000, len = Ox00020000 
} 
SECTIONS 
{ 
circdata :» buffer ext 
vectors - VECS 
„text > IRAM 
.bss > IRAM 
.cinit IRAM 
.Stack :> IRAM 
.sysmem > SDRAM 
const > IRAM 
switch > TRAM 
.far > SDRAM 
cio > SDRAM 





图 4.38 使 用 外 部 存储 器 作为 循环 缓冲 区 的 连接 命令 文件 ( FiRcire_ext.cmd ) 


建立 工程 FRcire_ext， 观 察 delays 地 址 的 存储 单元 ， 这 样 就 显示 出 外 部 存储 区 。 检 验 外 部 存 
储 器 中 的 循环 缓冲 区 , 400414 一 样 设置 断 点 、 仿 真 、 校 验 存在 循环 缓冲 区 末尾 的 最 新 抽样 以 及 
循环 缓冲 区 开始 的 下 一 个 抽样 。 暂 停 、 清 除 断 点 ， 检 验 输出 是 中 心 频率 为 1750 Hz 的 FIR 带 通 滤 
波 器 。 
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本 章 介绍 的 主要 内 容 包 括 ;( 1 ) 无 限 神 激 响 应 滤波 器 的 结构 ( 直接 型、 直接 工 型 、 囊 联 型 
和 并 联 型 ); (2) 滤波 器 的 双 线 性 变换 设计 方法 ; (3 ) 利用 差分 方程 产生 正弦 波 的 方法 ; (4) 滤 
波 器 的 设计 方法 和 实用 程序 包 ; (5) TMS320C6x MC 语音 程序 实例 。 

第 4 章 讨论 的 FIR 滤波 器 没有 对 应 的 模拟 部 分 作为 参照 ,本章 我 们 讨论 利用 已 有 的 模拟 滤波 
器 知识 设计 无 限 冲 激 响 应 〈 IIR ) 滤波 器 。 设 计 过 程 涉及 到 用 双 线 性 变化 法 BLT ) 将 模拟 滤波 器 
变换 到 数字 滤波 器 。 同 样 地 ， 双 线性 变换 法 能 将 » 域 模拟 泪 波 器 传输 亢 数 变换 到 等 效 的 z 城 数字 滤 
波 器 的 传输 函数 。 


5.1 引言 
考察 下 面 的 输入 输出 方程 ; 
y(n) - Y ax(n-k)- Ë by(n-j) . (51) ` 
on) tax (n 1) ban - 2) tax (n= N) (52) 
—b, y(n -1) - by (n-2) --- - byy (n— M) 


这 种 递归 形式 的 方程 表示 IR 滤波 器， 输出 不 仪 与 现在 的 输 人 有 关 ， 还 与 过 去 的 输出 有 关 CHE 
ft). BUE 时刻， 输出 y( 双 不 仅 与 当前 的 输入 x(n) 有 关 ， 还 与 过 去 的 输入 x(n — 1), x(n - 2). 
-，X(n - 入) 和 过 去 的 输出 y(n - 1), y(n-2), =, yo- MEX. — 
如 果 假 设 式 (5.2) 的 所 有 初始 条 件 全 为 0， 则 式 (5.2) 的 z 变 换 为 : 

Y(2)saX(z-az'X(z*a;z^X(2---ayz" X(z) 





-bzY(z2- bz?Y(z) —-.s-byz *Y(z) (5.3) 
令 式 (53) 中 的 N= M， 那 么 传输 函数 H(z) 可 写 为 : 
YO mar taz? +t ane” NG) 
HG) X(2) E 1+ dz +bz” eet bz" 7 D(z) (5.4) 
RHENG)SDGYMIBSOSA THE AUR. MAFTAHRINSRDALN, HORN: 
QAM tar fa + tan ofi 
H(2) = ZN 4 bz He by zh sor by T7 (5.5) 


REA N SER AN ME ASS RÉEL STA RK bA 0, ABA FS BOR ILS 4 
章 中 讨论 过 的 在 z 平 面 原点 有 NN 个 极点 的 FIR Ree, 4 章 的 讨论 可 知 ， 为 了 使 
系统 稳定 ， 所 有 极点 必须 在 单位 图 内 。 因 此 为 使 HR 渡 波 器 稳定 ， 每 个 极点 的 模 必 须 小 于 1， 也 
就 是 ， ` 


1. HURIPI <1, 那么 当 nn o, h(n) -0 时， 系统 是 稳定 系统 。 
2. NURIPI 1, RA%n 一 h(n) 2 时， 系统 是 不 稳定 系统 。 
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WIP = 1， 则 系统 就 是 产生 振荡 响应 的 临界 稳定 系统 。 另 外 ,单位 圆 上 有 冤 阶 极点 的 系统 
也 是 不 稳定 的 。 还 需要 注意 的 是 ， 如 果 所 有 系数 扇 = 0， 风 系统 就 变 成 了 非 递归 的 稳定 FIR 滤波 器 。 


5.2 IIR 滤波 器 的 结构 
下 面 将 讨论 几 种 HR jEQECSE RS AES, 


5.2.1 直接 1 工 型 结构 


直接 | 型 结构 如 图 5.1 所 示 ， 式 (5.2 ) 描述 的 滤波 大 可 用 这 种 结构 实现 。 图 5.1 隐 含 有 求 和 
的 功能 ， 图 中 没有 显示 出 来 。 对 一 个 NN 阶 滤波 器 ， 这 种 结构 需要 ON 个 延 时 单元 Fz. 84 
如 ， 二 阶 滤波 器 的 阶 数 N =2， 因 此 需要 4 个 延 时 单元 。 


xin) 8p yin) 





x(n- N) yin- M 
图 5.1 直接 IT 型 0R 滤波 器 的 结构 


52.2 ”直接 条 型 结构 


直接 TL 型 滤波 器 的 结构 如 图 5.2 所 示 ， 这 是 最 常用 的 滤波 器 结构 之 一 ， 这 种 结构 需要 的 延 时 
单元 是 直接 I 型 结构 的 一 半 。 例 如 ， 直 接 工 型 结构 的 二 阶 滤波 器 需要 两 个 延 时 单元 ， 而 直接 型 
结构 需要 4 个 延 时 单元 。 为 了 能 用 直接 工 型 结构 实现 式 ( 5.2 )， 定 义 延 迟 变量 U(z) : 


_ X(z) 
U(2) = D (5.6) 
其 中 Da 是 式 (5.4) 传输 函数 的 分 母 多 项 式 。 由 式 (5.4) ME (5.6  YGNnPS Nx. 
NDX 
Y(z) = = N(2U(z) 
D(a) (5.7) 


= U(zYao + az? +a? + tanz") 


BREMIE (5.4) 传输 函数 的 分 子 多 项 式 ， 由 式 (5.6) 可 知 : 
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X(z) = UDD) = UDU + bz! + biz +--+ buz”) (5.8) 


x(n) yin) 





图 52 HES W R MRAN 
WH (5.8) 做 z 的 逆 变 换 : 


x(n) = u(n)  buln — 1) + bouln -2) +--+ byuln- N) (5.9) 
对 式 (5.9) Hun) Re, 8l. 

u(n) = x(n) ~ bu(n — 1) - bun -2) - ---— byu(n- N) (5.10) 
对 式 (5.7) 做 z 的 逆 变 换 ， 可 得 : 

Y(n) = aou(n) + gu(n — 1) + aau(n - 2) +++ ayu(n - N) (5.1) 


直接 工 型 结构 可 用 式 (5.10) 和 式 (5.11) 表示 ， 图 5.2 中 的 延 时 单元 满足 式 (5.100, BL 52 
中 的 输出 (9 满足 式 (5.11) | 

Xx (5.10) 与 式 (5.11) 用 于 编程 实现 IR 滤波 器 ，u(n 一 1，uln 一 2)，.:. 的 初始 值 设 为 0。 
在 时 刻 n ,得 到 新 的 抽样 x()， 用 式 (5.10) Rhee), ete Abe HUE. 

| | y(n) = m(n) +0 
在 n+1 时 刻 , BBM x(n+1), 35 (5.100 中 的 延 时 变量 被 更 新 ， 也 就 是 ; 

u(n- 1) = x(n + 1) ~ bu(n) - 0 
ik u(n — Deena. AR (5.11), ne 1 时 刻 的 输出 为 ; 
y(n + 1) = asu(n + 1) + a(n) +0 | 

同样 ，n +2,n +3,… 时 刻 的 输出 也 可 计算 出 来 。 对 每 个 特定 时 刻 ， 当 采集 到 每 个 新 的 输入 抽样 
时 ， 延 时 变量 以 及 输出 就 可 以 根据 式 (5.10) 和 式 (5.11) 分 别 计算 出 来 。 





第 5 章 无 限 冲 激 响应 滤波 器 125 


523 Hen Hee 
直接 u 型 转 置 结构 是 直接 I 型 结构 的 改进 形式 ， 它 需要 相同 数目 的 延 时 单元 。 由 直接 I 型 
结构 变 成 直接 TE 型 转 置 结 构 需 要 以 下 步 又 :; 


1、 将 所 有 分 支 的 方向 变 成 相反 方向 ; 
2. 将 输入 与 输出 倒 过 来 ( 原 输入 变 成 输出 ， 原 输出 变 成 输入 ); 
3. HiB FH ( 和 通常 的 结构 一 样 )， 把 输入 节点 放 在 左边 ， 输 出 节点 放 存 右边 。 


直接 开 型 的 转轨 结构 如 图 5.3 Bia. 为 了 证 明 这 一 点 , Who (HR) us (n) ne 5.3 所 示 ， HRE 
结构 可 得 : 


u(n) = a;x(n) ~ by y(n) (5.12) 
in (n) = ax(n)— b y(n) + u (n - 1) (5.13) 
yin) = aux(n) *(n-1) | (5.14) 

用 式 (5.12) RH wln- D), RAR (5.13) 可 得 ; 
i (n) = ax(n) - bh y(n)  [asx(n - 3) - b y(n - 1)] (5.15) 

用 式 (5.15) oR Eta (n- D, RAA (5.14), Ba: 
Yn) = aox(n) + [a,x(n—1) ~ b y(n 1) + azx(n - 2) - b y(n -2)] (5.16) 


BARK (5.2) 一 样 ， 是 二 阶 系统 的 通用 输入 输出 方程 。 这 种 转 置 结构 先 实现 零点 ， 然 后 再 实现 
Rak. WHR I 型 结构 先 实现 极点 。 


(n) 





bo 





gn) 





图 5.3 BHD BE IR 滤波 器 结构 


5.2.4 ”串联 结构 
式 (5.5 ) 的 传输 函数 可 分 解 成 一 阶 或 二 阶 传输 函数 积 的 形式 ， 如 : 

H(z) = CHi(z2)H;(z) --- H,(z) (5.17) 
级 联 (GRAIG ) 结构 如 图 5.4 所 示 ， 整 个 传输 函数 可 表示 成 多 个 传输 函数 级 联 的 形式 。 对 每 个 级 
联 单元 ， 可 用 直接 [型 和 它 的 转 置 结构 表示 。 图 5.5 给 出 了 一 个 用 两 个 直接 也 型 二 阶 单元 级 联 实 
现 四 阶 OR 滤波 器 的 级 联结 构 。 传 输 函 数 召 (zj 用 二 阶 传输 函数 级 联 形式 表示 ， 可 写 为 ， 

Ra o. 7 uz? 
HO= TTE (5.18) 
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fal fap E 


图 5.4 SERA TIR 滤波 器 结构 


xin} uin) Hol yin) usin) 30: yin) 





图 5.5 ASME TI BARRE DU E EE ERE 


式 (5.17) 中 的 常数 C 可 合并 到 系数 中 去 , 每 个 部 分 用 下 标 i 表示。 例如， 对 和 = 4 的 四 阶 传 
HAR, HITEK: 


HO = taut” + anz? Aap + ane” tanz?) 
(1 buz’ + baz M1+ bnr! + bye) (5.19) 


A (5.19) 可 用 图 5.5 来 检验 。 从 数学 的 角度 来 外， 适当 改变 分 子 分 母狗 项 式 的 因子 位 置 不 会 影 
响 输 出 ; 但 从 实际 实现 的 角度 来 看 , 适当 改变 二 阶 单元 的 位 置 可 使 量化 噪声 0453 最小。 注意: 这 里 
第 一 级 单元 的 输出 内 (四 变 成 第 二 级 的 输 人 ,中 间 输 出 结果 保存 到 寄存 兰 中 , 对 它 提 前 截 短 所 造成 
的 影响 可 以 忽略 。 我 们 将 举例 说 明 用 二 阶 直 接 工 型 级 联 形式 实现 OR 滤波 器 的 方法 。 
52.5 并 联结 构 
A 65.5) 的 传输 函数 可 表示 为 ; 
A(z) =C + Hy(z}+ A, (2) +--+, (2) | (5.20) 
该 式 可 用 部 分 分 式 法 (PEE ) 得 到 ， 图 5.6 Kril SRS, REASBDAM ER ERE HL (2), 
有 H2(?)，… 可 以 是 一 阶 或 二 阶 函数 。 就 像 级 联 璃 结构 一 样 ， 并 联 型 结构 可 以 有 效 地 用 二 阶 直 接 TD 
型 结构 表示 出 来 。 召 ( 引 } 可 表示 为 :; 


AG ay; taz” + aur”? 
d I+ biz + buz? (5.21) 


例如 对 于 一 个 四 阶 传输 函数 ， 式 (5.21 ) TP HOD TREO 


tn tauz’ +427 da tan +ay27 
五 (村 三 区 二 一 一 一 一 十 -一 一 一 一 一 一 一 一 
K lebuz!4baz? — l9bgrcbni? (5.22) 


Hí(z-C«4 
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c 


xin) 





E56 并 联 型 HR RRRA 


图 5.7 用 两 个 直接 工 型 结构 单元 表示 成 一 个 四 阶 并 联 型 结构 的 IR. 滤波 器 。 册 图 5.7, 输 出 y(n) 
可 表示 成 每 个 并 联 单元 的 输出 之 和 的 形式 ， 也 就 是 ; 


NI 
yn) = Cx(n) + y yn) _ 6523) 






rain) 





Ugln) Ag 


图 5.7 两 个 直接 五 型 结构 单元 并 联 组 成 的 四 阶 OR 滤波 器 
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还 有 其 他 形式 的 滤波 器 结构 ， 像 格 型 结构 ， 这 种 滤波 器 结构 在 语音 和 自 适 应 滤波 处 理 中 非常 
有 用 。 虽然 这 种 结构 的 计算 效率 不 如 直接 I 型 或 级 联 型 结构 ， 需 要 较 多 的 习 法 运算 ,但 量化 效应 
WEBB SS, TIR 滤波 器 系数 的 其 化 误差 取决 于 复 平面 上 和 零 极 点 的 位 置 变 化 情况 ， 这 就 童 味 
着 一 个 特定 极点 位 置 的 偏 移 依 赖 于 其 他 位 置 的 所 有 极点 。 为 减 小 这 种 极点 闻 的 相互 依赖 性 ， 通 党 
用 二 阶 单元 级 联 实 现 六 阶 滤波 器 。 


53 双 线 性 变换 法 


双 线 性 变换 法 (BLT) 是 把 模拟 滤波 器 转变 成 数字 滤波 器 最 常用 的 方法 ， 它 使 用 式 (5.24) 
实现 :平面 到 z 平 面 的 一 一 上 映射: 
s= KZ (5.24) 
z+1 
其 中 的 常数 玉 通 常 选择 为 KK = 2 了 ，7 表示 抽样 变量 , 天 也 可 以 选择 其 他 值 , 因为 在 设计 过 程 中 它 
没有 影响 。 为 了 方便 说 明 双 线性 变换 过 程 ， 我 们 取 皮 = 1 或 T = 2， 代 人 式 (5.24), 可 得 : 


_l+s 


i-s 


z (5.25 ) 


这 种 变换 实现 了 下 面 的 观 射 : 


1. 将 s 平 面 的 左 半 平面 ， 对 应 g < 0 的 区 域 ， 映 射 到 z 平 面 单位 加 内 ， 
2. 将 s 平 面 的 右 半 平面 ， 对 应 6 > OAK, RIOR, 
3. 将 s 平 面 的 虚 轴 ， 映 射 到 z 平 面 的 单位 图 上 。 


令 W4。wp 分 别 表示 模拟 频率 和 数字 频率 ，5 = 04, z=, RAR (5.24) 18: 


0, = e» m] i eto (eivoTi2 —e Pari) 
IPA = RV] got? (ginal 4 umor À 


根据 用 复 指数 函数 表示 正弦 和 余弦 的 欧 拉 公 式 ， 式 (526) BH: 


Opt 
. 04 = tan 2 


( 5.26 ) 





(527) 


这 样 就 把 模拟 频率 和 数字 频率 联系 起 来 。 图 5.8 给 出 了 ms 为 正 数 时 两 者 的 关系 。ma 对 应 于 0 到 1 
区 间 映 射 为 Qo 的 0 到 wy4 比 较 好 的 线性 区 间 ， 这 里 吕 是 以 弧度 为 单位 的 抽样 频率 。 但 W4 > 1 的 整 
个 区 间 却 是 极其 非 线 性 的 ， 并 映射 为 bp 的 ay4 到 ay2 区 间 ， 在 这 个 区 域内 的 压缩 现象 称 为 频率 扭 
曲 现 象 ， 因 此 ， 需 要 用 预 畸 的 方法 来 弥补 这 种 失真 ， 频 率 wa 和 mo 应 满足 ， 
H (S) eja, = H(z ,oor (528) 

5.3.1 MERE 

双 线性 变换 法 利用 已 知 的 模拟 滤波 器 传输 函数 来 设计 数字 滤波 器 ， 它 能 使 用 成 熟 的 模拟 滤波 
器 传输 函数 ( 巴特 沃 斯 、 切 比 雪夫 等 ) 来 设计 数字 滤波 器 ， 附 录 D 介绍 了 用 MATLAB 实现 的 几 
种 形式 的 滤波 器 。 切 比 和 雪夫 1 型 和 工 型 滤波 器 分 别 在 通 带 和 阻 带 内 实现 了 等 波动 响应 。 对 于 一 个 
给 定 指标 ， 这 些 滤波 器 比 通 带 和 阻 带 都 是 单调 变化 的 巴特 活 斯 滤波 器 的 阶 数 杰 更 低 。 椭 团 滤波 器 


在 通 带 和 阻 带 都 是 等 波动 的 ， 它 的 阶 数 比 切 比 雪夫 型 滤波 器 更 低 ， 但 它 更 难 设计 ， 因 为 它 的 相位 响 
应 在 通 带 内 是 非 线性 的 。 虽 然 巴 特 沃 斯 滤波 器 需要 更 高 的 阶 数 , 它 的 相位 响应 在 通 带 内 是 线性 的 。 
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图 5.8 ”模拟 频率 和 数字 频率 间 的 关系 


为 了 利用 双 线 性 变换 法 求 出 五 (z] ， 需 要 以 下 几 个 步骤 : 
1， 找 一 个 已 知 的 模拟 滤波 器 传输 函数 百 (9); 
2. UBB RRS AMO, fri: (5.27) 的 模拟 频率 04; 
3. XHÁESEDHESTU IR UE AERO, EA X, (5.29): 
Hs) un, (5.29) 
4， 用 双 线 性 式 【5.24 ) RB) H(z), ists. 
H(z) = H(s/@a ten (5,30) 


APS A LR aE. ETS eA PR A ROD AO, ABER MA 
率 @ma 和 名， 附录 已 中 的 练习 进一步 说 明了 双 线 性 变换 过 程 。 


5.4 设计 JR BS C 语言 程序 实例 


本 节 介 绍 5 个 程序 例子 ， 说 明 如 何 用 级 联 直 接 开 型 结构 单元 实现 HR 滤波 器 以 及 用 差分 方程 
产生 音频 信和 号 。 


例 5.1 用 二 阶 单元 的 级 联结 构 实现 HR 滤波 器 
图 5.9 给 出 了 一 个 用 二 阶 单元 级 联 实现 通用 TIR 滤波 器 的 C 程序 ， 该 程序 每 个 单元 使 用 了 下 
面 的 两 个 方程 ; 


u(n) = xin} - buin - 1) ~ bu(n - 2) 
yín) = aulin) + a;u(n 一 1) + asu(n - 2) 
对 每 个 n RAEN, ETARA DO 5 次 (级 联 单元 的 级 数 ) 对 于 第 一 个 级 联 单 
元 ,x(m) 是 一 个 新 采集 的 输入 抽样 ， 但 对 其 他 级 联 单元 ， 输 入 x(1) 就 是 前 一 级 的 输出 y(n)。 
系数 vA] BLING b 和 bo. i 表示 属于 万 一 级 ， 延 时 diyli)EO Rt diyL][ 1143 5:6] fi 
u (n — DFI u í- 2). 





130 DSP 原理 及 其 C 编程 开发 技术 





{/tIR.ce IIR filter using cascaded Direct Form II 
//Coefficients a's and b's correspond to b's and a's, from MATLAB 


#include "bs1750.cof* //BS € 1750Hz coefficient file 
short dly[stages][2] = {0}; //delay samples per stage 
interrupt void c_intil1() //I8R 


i 
int i, input; 
int un, yn: 


input = input samplei): //input to lst stage 
for (i = 0; i « stages; i++) //repeat for each stage 
{ 
unzinput-(ibIil[Ol]*dly[i]TO])2215) - f¢bfi] [1)*a@ly{4} [1])>>15); 


yns=(¢a[i] [0] *un}>>15}+( (aij [1] *dly(i] [0] }>>15)+((a(i] (2] *d1y [T3] [1]}>>15); 


dly[i] [1] = dly(il{ol; //update delays 
@lyjil [Gi = un; //update delays 
input = yn; l //intermediate output-»in to next stage 
H 
output sampletyn); //output final result for time n 
return; //return from ISR 
} 
void main(í) 
{ . 
comm intr(); /finit DSK, codec, McBSF 
while({1); //infinite loop 


1 








图 5.9 二 阶 单元 组 联 实现 I[ 焉 AS C EY. (Re) 


IHR 带 阴 滤波 器 
系数 文件 bs1750.cof ( 如 图 5.10 所 示 ) 是 由 附录 D 得 到 的 ， 它 表示 一 个 10 阶 带 阻 滤波 器 ， 
是 用 MATLAB 的 SPTOOL 工具 设计 的 ， 如 图 D.2 所 示 。 注 意 MATLAB 设计 工具 显示 阶 数 是 5， 
是 指使 用 的 一 阶级 联 单元 的 数目 。 系 数 文件 包括 分 子 系数 ( 每 级 三 个 ) as 和 分 母系 数 b's ( 每 级 
两 个 )。 这 本 书 里 用 的 a's 和 b’s 分 别 对 应 MATLAB 中 的 ps H ase 
建立 并 运行 工程 IR， 检 验 输 出 是 否 是 中 心 频率 为 1750 Hz IR 带 阻 滤波 器 。 图 5.11 是 利 
用 SP 分 析 仪 得 到 带 阻 滤波 器 的 输出 频率 响应 的 结果 ( 这 里 用 噪声 作为 分 析 仪 输入 )。 
IIR SiG AE | 
1. 用 系数 文件 bp2000.cof ( 在 辅助 材料 中 ) 重新 建立 该 工程 ， 它 表示 一 个 36 阶 (18 级 ) 切 
EEA W IR 带 通 滤波 器, 中 心 频率 为 2 kHz。 滤波 器 是 用 MATLAB 设计 的 , 如 图 5.12 
所 示 ， 检 验 滤波 器 的 输出 是 中 心 频率 为 2 kHz 的 IR 带 通 滤波 器 。 图 5.13 是 该 36 Er IIR 
带 通 滤波 器 的 输出 频率 响应 ， 它 是 用 HP 分 析 仪 获得 的 。 
2. 用 系数 文件 jp2000.cof ( 在 辅助 材料 中 ) 重新 建立 该 工程 ， 它 表示 一 个 8 Er Im MBE 
波 器 , 鹤 上 频率 为 2kHz ( 同样 是 用 MATLAB 来 设计 的 ), 检验 低 通 TIR 滤波 器 的 输出 是 
FEM., 
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//bz1750.cof IIR bandstop coefficient file, centered at 1,750Hz 


#define stages 5 //number of 2nd-order stages 
int alstages] [3]= { //numerator coefficients 
127940, -10910, 27940}, //al0, ali, ai2 for ist stage 
(32768, -11841, 32768), //a20, a21, a22 for 2nd stage 
{32768, -13744, 32768), //a30, a31, a32 for 3rd stage 
(32768, -11338, 32768), //aA0, a41, a42 for 4th stage 


(32768, -14239, 32768) ); 


int b[stages] [2]= { //*denominator coefficients 
(-11417, 25710}, //bil, b12 for 1st stage 
(-9204, 31581], //b21, b22 for 2nd stage 
(-15860, 31605}, //b3l, b32 for 3rd stage 
(-10221, 32581), //b4l, b42 for 4th stage 
(-15258, 32584) un //b51, b52 for Sth stage 





图 5.10 MATLAB 设计 的 10 B DR 带 阻 滤波 器 系数 文件 {bs1750.cof ) , SILER DD 


RANGE! 1 dBV STATUS: PAUSED 
AMAG RMS? 18 





-32 
START! B Hz 
Ra z 


RTE Bh Hz STOP: 4 006 Hz 


图 5.11 HP ArI 10 Hr IR, SEDER RIA 1750 Hz 


例 5.2 用 两 个 二 阶 差分 方程 产生 两 个 音频 音 


本 例 使 用 差分 方程 产生 两 个 音频 音 并 将 它们 相 加 , 输出 保存 在 存储 器 中 , 并 用 CCS 画 出 相应 
的 图 形 。 产 生 正 弦 波 的 差分 方程 是 : 


y(n) = Ay(n — 1) - y(n - 2) 
其 中 
A = 2co0s(wT) 


y(-1) = -sin(@7) 
y(-2) = ~sin(20T) 
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m petra - 
MATLAB 滤波 器 设计 工具 ( SPTOOL ) 显示 的 36 Br IIR 带 通 滤波 器 的 频率 特性 


RANGE: 3 dBV STALYTS PAUSED 











9 


-90 
START Wt 39:194 Hz STOP! 4 888 Hz 


bee Hee vi 983.38 dB 

图 5.13 HP 分 析 仪 得 到 的 36 Wh IIR 带 通 滤波 器 的 输出 频率 响应 ， 滤 波 器 中 心 频率 为 2000 Hz 
y - ftl y(-2) 是 两 个 初始 条 件 ，w = 2nf, 抽样 周期 了 = 1/F,= 1/(8 kHz) = 0.125 ms. y(n) 的 z 变 换 为 : 
Y(z) = Az? Y (z) + y(-1)} - (z?Y(z) + z*y(-1) + y(-2)} 


也 可 写成 : 
Y(z)1 - Az? + z?) = Ay(-1) - z` y(-1) - y(-2) 
= —2cos(@7)sin(@T) + z 'sin(oT) + sin(20T) 
=z" sin(@7) 
求 得 Y(z) 为 : 


Y(z) = zsin(oT)/(z? - Az + 1) 
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Y(z) 的 z 的 道 变换 是 ， 
y(n) = ZT" (Y(z)] = sin(naT) 
M f= 1.5 kHz Hj: 
A = 2c0s(@7} = 0.765 -> AxX2* = 12540 
y(-1) = -sin(oT) = -0.924 -> y(-1)x2" = -15 137 
y(-2) = -sin(2w7) = —0.707 一 y(-2)x2" = -11 585 
MS f=2kHz Hf: 
A=0 
y(-1) = -1 2 y(-1)2"* = -16 384 
y(-2) = 0 
二 和 阶 差分 方程 的 系数 4 和 两 个 初始 条 件 决 定 产生 的 频率 。 为 了 用 定点 实现 ,需要 对 它们 进行 
定 标 《 归 一 化 处 理 )。 使 用 差分 方程 ， 
| y(n) = Ay(n - 1) - y(n - 2) 
天 =0 时 的 输出 为 : 
y(0) = Ay(-1) - y(-2) = —2cos(oT)sin(o7) + sin(Z@T) = 0 
5.14 给 出 了 用 差分 方程 产生 音频 音 的 C 程序 two, tones.c, UA y1[3] 保 在 生成 L5 kHz & 
频 音 的 三 个 数据 : y1(0, »y1(71)mylC2), 数组 72[3] 保 存 生成 2 kHz 音频 音 的 三 个 数据 : y2(0)， 
y2(-1)81y2(-2). 函数 sinegen 使 用 二 阶 差分 方程 产生 每 个 音频 音 ， 再 把 两 个 信 SHAM, AT EH 
实现 得 到 更 好 的 结果 ， 将 每 个 数 语 时 除 以 21。 
建立 并 运行 工程 two_tones， 检 验 输出 是 1.5 kHz 和 2 kHz 两 个 音频 音 的 和 ， 输 出 也 保存 在 存 
情 缓冲 区 中 。 使 用 CCS 画 出 如 图 5.15 所 示 的 两 个 正弦 信号 的 FFT 幅度 谱 。 缓 症 区 的 起 始 地 址 是 
sinegen buffer (也 可 参见 例 1.2 )。 
上 述 技术 也 语 用 于 产生 到 音 多 频 信 号, 例如, 产生 697 Hz 和 1209 Hz 的 两 个 音频 信号 并 把 它 
们 相 加 ， 这 正好 对 应 电话 中 的 按键 “3”， 
例 5.3 用 差分 方程 产生 正弦 波形 


该 例 用 另 一 个 差分 方程 也 同样 产生 正弦 音频 音 ， 可 参见 产生 两 个 音频 音 并 对 它们 进行 相 加 的 
例 5.2。 考 察 第 4 章 中 得 到 的 二 阶 差分 方程 ; 


y(n) = Ay(n - 1) + By(n - 2) + Cx(n - 1) 
这 里 B = —1, Mn = 1] 时， 使 用 一 个 冲 激 信和 号， 这样 得 到 x(n — 1) = x(0) = 1, 其 他 均 为 0。 对 于 
n=l, 有 : 
y(i) = Ay(0) + By(-1) + Cx(0) = C 
其 中 六 0) =0，y(-1)=0。 对 于 n 22, 有 : 
y(n) = Ay(n - 1) - y(n ~ 2) 
给 定 抽样 时 间 了 ~ 1/F, 和 所 需 频率 @， 计 算 系数 4 = 2cos(T), C= sin(@7) , 
4 f = 1.5 kHz 时 : 





134 DSP 原理 及 其 C 编程 开发 技术 


A = 2cos(@T) = 0.765 一 Ax2" = 12 540 
yD) = C = 0.924 > Cx?" 215137 
y(2) = Ay(1) = 0.707 — y(2)x2" = 11585 
24 f = 2 kHz 时; 
A = 2cos(mT) = 0 
y(1) = C =sin(wT) = 1 > Cx2™ = 16 384 
y(2) = Ay(1} ~ y(0) = AC -0 


//two_tones.c Generates/adds two tones using difference equations 


short sinegen {void}; //for generating tone 

short output; //for output 

short sinegen_buffer [256]; /fbuffer for output data 

const short bufferlength = 256; //buffer size for plot with CCS 


short i - 0; //buffer count index 


short y1[3] = [0,-15137,-11585); //yl(0),yli-1),yii-2) for 1.5kHz 


const short Al = 12540; //Al - 2coswT scaled by 2^14 
short y2[3] = (0,-16384,0):; /Ffy2(0),y2(-1),y2(-2) for 2kHz 
const short A2 = Db} //A2 = 2JcoswT scaled by 2^i4 
interrupt void c, intlií()  /f/18R 
{ 
output = sinegen(}; //out Erom tone generation function 
sinegen buffer(i] = output; /foutput into buffer 
output, sample (output); //output result 
i++; //increment buffer count 
if (i == bufferlength) i = 0; //if buffer count=size of buffer 
. return; /freturn to main 
} 
short sinegen(í! //function to generate tone 


{ 
Yi{0] =¢¢((imedyl[1]}*(int)Al))>>14)-y1[2]; //ylí(n)sAl*ylin-1)-y1lin-2) 


yli2] = ylí1]: / iupdate ylín-2) 

ylf1] = y1[0]; , //update yl(n-1) 

y2[0] =(((Cint}y2[1]* (int}A2))>>1d)-y22]; //y2(n) =A2*y2 (n-1}-y2 (n-2) 
y212] = y2[1]; /fupdate y2(n-2) 

yall] = y210]1; /fupdate y2(n-1) 

return (yl1[0] + y2[0]1): : ffadd the two tones 


) 


void maini} 

{ 

comm intrí): //init DSK, codec, McBSP 
while(1); //infinite loop 

} 





5.4 ”产生 双 音 并 进行 相 加 的 程序 ( two_tones.c ) 
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图 5.15 利用 CCS 画 出 的 双 音 FFT 幅度 谱 


图 5.16 给 出 了 sinegenDE.c 程序 ， 它 用 另 一 个 差分 方程 产生 正弦 波 信和 号。 该 程序 使 用 实现 例 5 2 
的 另 一 种 方案 ， 在 中 断 服务 程序 (SR) 内 计算 差分 方程 。 为 了 产生 2 kHz 的 正弦 波 ， 取 系数 
4 =0，y(0)，y(1) 和 y(2) 保 存在 数组 y[3] 中 。 

建立 并 运行 工程 sinegenDE， 检 验 输出 是 否 是 一 个 2 kHz 的 音频 信和 号。 将 数组 和 A 的 值 改 
为 y[3]= {0,15 137,11 585), A = 12 540， 重 新 运行 程序 ， 检验 输出 是 否 是 1.5 kHz 的 音频 信和 号 ; 
=Í A= -23 170，y[3] = (0,115 85,0} 时 ， 输 出 应 为 一 个 3 kHz 的 音频 信号 。 


//SinegenDE.c Generates a sinewave using a difference equation 
short y[3] = {0,16384,0}; //y(1) = sinwT 


const short A = 0; //K = 2*coswT * 2°14 
int n = 2; 


interrupt void c_int11() //ISR 

{ 

y(n) = (((int)A*(int)y[n-1])>>14) - Yy[n-2]; //y(n) = Ay (n-1) -y(n-2) 
y[n-2] = y[n-1]; //update y(n-2) 

Y[n-1] = y[n]; //update y(n-1) 

output sample(y[n]); //output result 

return; //return to main 

} 

void main() 

{ 

comm intr(); //init DSK, codec, McBSP 
while(1); //infinite loop 


) 
图 5.16 ”利用 差分 方程 生成 正弦 波 的 程序 ( sinegenDE.c ) 
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例 54 用 整 分 方程 产生 正弦 扫 频 信号 
图 5.17 给 出 了 产生 正弦 扫 频 信号 的 程序 sweepDE. c, 它 实现 差分 方程 
y(n) = Ay(n ~ 1) - y(n - 2) 

其 中 4 = 2cos(@T), 初始 条 件 是 7(-1) = sin(wT)，y(-2) = -sin(2wT)。 例 5.2 说 明了 使 用 该 差 
分 方程 产生 正 芝 波 的 方法 。 

在 程序 中 ,信号 初始 频率 设 为 500 Hz， 并 以 10 Hz 为 步 进 ， 直 到 最 高 频率 3500 Hz， 每 个 频 
率 的 正 嘴 信号 持续 时 间 设 置 为 200。 为 提高 扫 频 速度 ， 可 减 小 每 个 频率 的 持续 时 间 。 

初始 频率 设 为 500 Hz, AAA = 30 274, y(0)=0, y(-1)2 6270, y(-2) = -1 585 (参见 
例 5.2), 对 每 个 频率 〈510，520… )， 调 用 函数 coeff gen 计算 实现 差分 方程 的 新 的 一 组 系数 4， 

y(n — 1yfü y(n 一 功用 滑动 条 控制 扫 频 信号 的 一 些 参数 ， 加 频 衬 力 进 及 在 每 个 频率 上 持续 的 时 间 。 
建立 并 运行 工程 sweepDE， 检 验 输 出 正弦 扫 频 信 SHEHE 


5.5 IR 道 滤波 器 设计 

该 例 介 绍 了 IR 逆 滤 波 器 的 实现 ， 用 噪声 作为 输入 ,计算 前 置 OR 滤波 器 的 输出 。 前 置 TIR 
滤波 器 的 输出 变 成 IR 道 滤波 器 的 输入 ， 道 滤波 器 的 输出 是 原始 的 噪声 序列 。 例 4.10 实现 了 FIR 
逆 滤 波 器 ， 例 5.1 实现 了 OR 滤波 器 。 

IIR 滤波 器 的 传输 函数 为 : 





H) = 
Y b, zi 
j=l 


HR 2E 28 93H HAP 
N-i M-1 
y(n) = ¥ ax(n-)- Y, byin- j) 
iad) j=l 
这 里 x(n - 问 表 示 输 入 序列 ， 输 入 序列 x(m) 可 用 Xn) 作 为 x(m) 的 估计 ， 即 : 
M-l N-1 
y(n)+ È byin- D- X as(n-i) 
j=l ix] 
ido 
程序 HRinverse.c ( Jf] 5.18) 实现 了 IR wipe dE. 
建立 工程 DRinverse, HEE ( 用 噪声 发 生 器 或 Goldwave 软件 产生 ) 作为 输入 ， 运 行 工程 ， 
检验 输出 结果 是 否 为 输入 噪声 (这 时 潮 动 条 在 默认 位 置 1 )。 
把 滑动 条 放 在 位 置 2, 检验 前 置 IR 滤波 器 的 输出 是 中 心 频率 为 2kHz AOA RE, TIR 滤 
波 器 是 用 例 5.1 的 系数 文件 bp2000.cof 来 实现 的 。 当 洽 动 条 放 在 位 置 3 时 ， 验 证 TIR Bee AY 
输出 是 否 为 原始 输入 虞 声 序列 。 


在 该 例 中 ， 前 置 滤 波 器 的 特性 是 已 知 的 ， 可 以 把 它 扩 展 到 滤波 器 特性 是 未 知 的 情况 ， 这 时 ， 
前 去 滤波 器 的 系数 as 和 b's 可 用 Prony 方法 估计 出 来 加。 


x(n} = 
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//fweepDE.c Generates a sweeping sinusoid using a difference equation 


#include «math.h» 


#define two_pi (2*3.1415926) //2*pi 
#define two_14 16384 //2^14 
#define T 0.000125 //sample period = 1/Fs 
#define MIN FREQ — 500 /finitial frequency of sweep 
#define MAX FREQ 3506 //max frequency of sweep 
#define STEP_FREQ 10 //step frequency 
#define SWEEP_PERIOD 200 //iasting time at one frequency 
short yO = 0; //initial output 
short y.1 = -6270; //y(-1)--sinwT(scaled) £-500Hz 
short y.2 - -11585; //y(-2 --sin2wT(scaled) f-500Hz 
short A = 30274; //À = 2*coswT scaled by 2°14 
short freq = MIN_FREQ; //current frequency 
short Sweep count = 0; //counter for lasting time 
void coeff_gen(short) ; //function prototype for coeff 
interrupt void c intll() //ISR 
{ 
sweep_count++; //incr lasting time at one freq 
if(sweep count »- SWEEP PERIOD) //time reaches max duration 
i 
if(freq »- MAX FREQ) //if the current frequency is max 
freq - MIN FREQ; //reinit to initial frequency 
else 
freq = freq + STEP FREQ; //incr to next higher frequency 
coeff gen(freq): . //tunction for new set of coeff 
sweep count = 0; //reset counter for lasting time 
} 
yO=(((int}A * (int)y I)2214) - y 2; //y(n) = A*y(n-1) - yin-2) 
y.2 = y 1; //update y(n-2) 
y.l = Y0; //update yin-1| 
output sample(y0); //output result 
} 
void coeff gen(short freq) //calculate new set of coeff 
{ 
float w; //angular frequency 
w = two pi*freq: //w = 3*pi*f 
A = 2*cosi(w*T)*two 14; //À = 2*coswT * (2°14) 
y_i = -sin(w*T)*two 14; //y l = -sinwT *(2^14) 
y.2 - -sin(2*T*w)*two 14; /fy.2 = -sin2wT * (2^14) 
return; 


} 


void main() 

{ 

comm intrí); //init DSK, codec, McBSP 

while(1):; //infinite loop 

} 
eee 


5.7. WAZON EPHESUS SWE ( sweepDE.c ) 
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//IIRinverse.C Inverse IIR Filter 


#include "bp2000.cof* //BP @ 2kHz coefficient file 
short dly[stages][2] = (0); //delay samples per stage 
short out type = 1; //type of output ‘for slider 
short a0, al, a2, bl, b2; //coefficients 

interrupt void c intll() //ISR 


short i, input, inputl; 
int unl, ynl, un2, input2, yn2; 


inputi = input sample(); //input to lat stage 
input = inputl; l //original input 
for(i = 0; i « stages; i++} //repeat for each stage 
{ 

al = ((a[i][1]*dly[i][0])>>15); //ai*u(n-1) 

a2 = ((a[i]l[2]*dly[i][1])»215); //a2*uín-2) 

bl = ((b[il[O0]*aly[i][O0])2215); //bl*uíin-1) 

b2 = ((b[il[1]*dly[il[1])*»»15); //b2*uin-2) 


unl = inputi - bl - b2; 
aD=( (a[i] [0] *unl)>>15}; 


ynl = a0 + al + a2; /f/stage output 
inputl = ynl; //intermediate out-»-in next stage 
dlyIi]fi] = dly[i] [0]; //update delays u(n-2) = u(n-1i) 
diy[ij(0] = unl; //update delays uin-i) = utn) 
) . 
input2 = yni; /fout forward-in reverse filter 
for(i = stages; i > 0; i--) //for inverse IIR filter 
{ 
al = (fali)[l)*dly[i] £0)}>>15); //alu(n-1) 
a2 = (faji)[2}*dly[i]{1)}>>15); //a2u(n-2) 
bl = ((b[illO0]*dlyili][O])2215); //bluin-1) 
b2 = ({b(i} (1])*dlyf{i} [1]}>>15); //b2u(n-2} 
un2 = input2 - al - a2; 
yn2 = {un2 + bl + b2): 
input2 = {yn2<<15) /a[li} [0]; //intermediate out->in next stage 
} 
if(out_type == 1) //if slider in position 1 
output, sampleí(input]; //original input signal 
if(out type == 2) 
output sampleíynil); f/foutput of forward filter 
iffout type == 3) 
output, samplei(yn2 >>6}; //output of inverse filter 
return; /freturn from ISR 


} 


void main() 

{ 

comm intr (}; //init DSK, codec, McBSP 
while(1); //infinite loop 

} 





图 5.18 KA IR 道 滤波 的 程序 (IRinversec ) 
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第 6 章 快速 傅 里 叶 变 换 


本 章 主要 内 容 包括 :(1) 基 2 和 和 基 4 的 快速 傅 里 叶 变 换 ; (2 ) 时 域 和 频 域 的 抽取 或 分 解 ; ( 3 ) 
编程 实例 。 

Ts UR HERES ( FFT ) 基于 离散 傅 里 叶 变 换 ( DFT ), 它 是 一 种 将 时 域 信号 转 模 成 等 效 的 频 
域 信号 进行 运算 的 高 效 算 法 。 本 音 除 了 介绍 其 基本 原理 外 ， 还 给 出 了 实时 的 FFT 编程 实例 。 


61 引言 


离散 傅 里 叶 变 换 将 时 域 序列 转换 成 相应 的 频 域 序列 ， 而 离散 和博 里 叶 道 变换 进行 相反 的 运算 ， 
将 频 域 序列 变换 成 等 效 的 时 域 序列 。 快速 传 里 叶 变换 基于 离散 傅 里 时 变换 , 但 只 需要 较 少 的 运算 ， 
它 是 一 种 高 效 的 算法 。 在 数字 信号 处 理 中 ，FET 是 对 信号 进行 频谱 分 析 的 最 常用 算法 上 59。FFT 运 
算 有 两 种 方法 : 按时 间 抽 取 和 按 频 率 抽取 。FFT 算法 的 几 个 变种 ，Winograd "ERU, RAAR 
变换 (DCT), Wik Hartley 变换 "3 也 常 被 使 用 。 基 于 DCT, FHT 和 FFT 算法 的 程序 可 参见 
文献 四。 


62 32 FFT 算法 
FFT 算法 极 大 地 减少 了 离散 传 里 叶 变 换 (DET) 的 运算 量 ， 离 散 时 间 信 号 x(nT) 的 DFT X: 
x)= S (yw | ks04,-,N-1 E (6.1) 
其 中 抽样 周期 隐 含 在 x(m) 中 ,， 丸 为 帧 长 。 常 数 W 称 为 旋转 常数 或 因子 ， 它 表示 相位 , 是 六 的 函 
数 ， Bl: 
W gs (62) 
Xfk20,1,-,N 21, © (61) 可 写 为 ， 
X(Kk)2 x(0)  x(1W* + x(2)9W7* +++ x(N - 1)W Dt (6,3) 


这 表示 一 个 N x NAPE, BIOS X(K) 需要 计算 NN 个 值 才 能 得 到 全 部 的 X(K)。 由 于 式 (63) 是 复 
指数 的 等 式 , 对 于 每 个 上 值 , MAN - 二 次 复数 加 法 和 六 次 复数 莱 法 运算 , 因此 共 需 要 (N? - N) 
次 复数 如 法 和 如 次 复数 乘法 和 运算。 对 于 DFT 来 说 ， 这 就 需要 非常 大 的 运算 量 ， 尤 其 是 在 入 值 比 
较 大 时 ， 而 FFT 将 全 的 运算 量变 为 NlogN， 从 而 大 大 减少 了 运算 量 。 

FFT 算法 利用 了 旋转 因子 的 周期 性 和 对 称 性 优点 ， 减 少 了 FFT 的 运算 量 。 由 旋转 因子 的 W 
周期 性 ， 可 得 : 


wer = We (64) 
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由 W ART ERE : 


wtf =-W* ( 6.5) 
图 6.1 给 出 了 N = 8 时 WW 的 性 质 , 例如 , Sk 22, 由 式 (6.4) 可 得 , We = W?, 再 由 式 (6.5), 
可 得 Wi = -W?, i 


对 于 基 2 的 方法 ，FFT 算法 将 NN 点 DET 分 解 成 两 个 Ni2 点 或 更 短 的 DFT， 每 个 N12 点 的 DFT 
再 分 解 成 两 个 N/4 点 的 DFT, 该 过 程 一 直 持 续 下 去 , 直到 最 后 分 解 成 NA2 个 两 点 的 DET, 最 少 的 变 
换 点 数 取决 于 FFT 的 基 。 对 于 基 2 FFT, NEME? SO, 最 后 分 解 成 两 点 的 DFT。 对 于 基 
4 的 FFT， 景 后 分 解 成 4 点 的 DFT, 





We = Wi ... 
图 6.1 旋转 因子 WW 的 周期 性 和 对 称 往 


6.3” 频 域 抽取 的 基 2 FFT 算法 


将 时 域 输入 序列 x(n) 分 成 两 部 分 ， 
(a) x(0), x(1)--. {2 -1] (66) 
和 
(b) (3 oF} ND (67) 
对 式 (6.6) 和 式 (6.7) 每 个 序列 进行 DFT， 可 得 : 
(N/2)1 N-1 
X(k)= $ x(r)W"* + 2 x(n)W7* (68) 
Raul) HnuNT2 


Hn — n NILAASR (68) 的 第 二 个 求 和 项 ， 有 : 
Xík)= * [- fn p /— (69) 


其 中 ， 由 于 We Rn HRA, AULA FSR ARK, RUE 


WN ein (e) = (cosn - jsin n = (AY 
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RAK (69) rh, M: 


X(9- $ poc (npe: (640) 


因为 当 kM, (71 —1, mp3 koX ABI, CIF = -1, HR (6.10) 按 上 的 奇 个 情况 
分 开 ， 可 得 ; 


1. 下 为 偶数 时 


X(k)= PA | | (6.11) 


nw) 


2. 下 为 奇数 时 


X(k)= * [x - (ne (612) 


Hk = 2k RPA k, k 22k + LER k, COLL) 和 式 (6.12) k 20,1, 
NI -1 时 可 写 为 : 


XQi)- $ oes 2j Ink (6.13) 


xQk+1)= * [sien (6.14) 


AAR T WEKE NHRA, SRR Wy, BEW GRWa. F: 


a(n) = x(n) + x(n« N/2) (6.15) 
b(n) = x(n) - x(n+ N/2) (6.16) 
A (6.13) AX (6.14) 可 以 更 简洁 地 写成 两 个 NA/2 点 的 DFT， 也 就 是 ， 

(N i 

X(2k)= $ a(nWy, (6.17) 
nul . 

(N/2-1 

XQk-0)- $ b(nWAWyh, (618) 


图 6.2 显示 了 N = 8 时 ， 由 NN 点 DFT 分 解 成 两 个 Ni2 点 的 DET 的 过 程 。 从 上 述 的 分 解 过 程 可 
以 看 出 ， 图 6.2 中 世间 的 偶数 部 分 在 上 半 部 分 ， 奇 数 部 分 在 下 半 部 分 。 分 解 过 程 可 以 重复 进行 下 
去 ,这 时 每 N22 点 的 DFT 进一步 分 解 成 两 个 Ni4 点 的 DFT， 图 6.3 再 次 说 明 N = 8 的 分 解 过 程 。 

图 62 输出 序列 上 半 部 分 生成 图 6.3 的 序列 (0) 和 下 4), 表示 偶数 部 分 ,图 6.3 的 (2) 和 XX(6) 
表示 奇数 部 分 。 同样, 图 62 输出 序列 的 下 半 部 分 区 (1) 和 XY(5)， 表 示 侦 数 部 分 ， 而 (3) 和 友 (7) 表 
示 奇 数 部 分 , 这 种 顺序 打 乱 是 由 分 解 过 程 造 成 的 。 最 答 输 出 序列 的 顺序 XXX0), X(4),---, ATELY, 
如 图 6.3 所 示 ， 因 此 输出 结果 需要 重新 排序 。 在 后 面 的 章节 中 ， 将 给 出 含有 适当 的 排序 函数 的 程 
序 例子 。 输 出 序列 站 (上) 表示 时 间 序 列 x(n) 的 DFT。 
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X(0) 
X(2) 
X(4) 
X(6) 
X(t) 
X(3) 
X5) 
X07) 





图 6.2 NX DFT 分 解 成 两 个 N22 点 的 DFT, N=8 


第 1 级 造 代 第 2 BER FIRER 
X(0) 


Xia) 
x(2} 
-X(6) 
X(1) 
X(5) 
X(3) 
X(7) 





Hl6.3 两 个 NI 分 解 成 4 个 NIA 点 的 DFT, N=8 


这 是 最 后 的 分 解 , 因为 现在 有 Ni/2 个 两 点 DFT, 对 基 2 的 FFT, 这 是 最 低 分 解 。 对 两 点 的 DET 
来 说 ， 式 (6.1) 中 的 X(K) 可 表示 为 : 


X()- Y (nw k=0,1 (6.19) 

4 
X(0) = x(0)W*  x(1)W? = x(0) + x(1) (620) 
X(1) = x(0)W? + x(1)W? = x(0) ~ x(1) (621) 


AAW! = e? = —1, 35 (620) 与 式 (6.21) 可 表示 成 图 6.4 所 示 的 流 图 ， JB EIOS EE, 
Ed 6.5 RANT 8 FFT 算法 的 最 终 流 图 ， 这 种 算法 称 为 频率 抽取 方法 ， 因 为 输出 序列 Xk) 分 解 





144 DSP 原理 及 其 C 编程 开发 技术 


(抽取 ) 成 最 小 的 子 序列 ， 这 种 过 程 一 直 继 续 (和 挝 代 ) 8M S6, 3X EN = 2", 输出 X(k) 是 有 实 
SRA LR, FFT 对 复数 和 实数 输入 序列 都 适用 。 


x(0) X(0) = x(0) + x(t) 


x(1) — X(1) = x(0) - x(1) 
图 64 两 点 的 FFT REE 
FFT 并 不 是 对 DET 的 近似 ， 它 和 DFT 的 结果 是 完全 一 致 的 ， 但 只 需要 较 少 的 运算 量 ， 而 这 
种 运算 量 的 减少 对 高 阶 FFT 运算 越 来 越 重 要 。 
还 可 用 其 他 结构 来 解释 FFT 算法 , 图 6.5 的 另 一 种 流 图 是 把 输入 扰乱 , 输出 按 自然 顺序 排列 。 
下 面 通过 练习 说 明 8 点 的 FFT 算法 过 程 ， 从 图 中 可 以 看 出 ， 高 阶 流 图 (ON 较 大 ) 也 是 较 容 易 
得 到 的 。 
x{0 
x(1 
x(2 
x{3 
x(4 
x 
x(6 
x(7 





图 6.5 使 用 频率 抽取 的 8 点 FFT 流 图 
练习 不 1 频率 抽取 法 的 8 点 FFT 
输入 矩形 信号 x(n)， 即 x(0) = x(1) = x(2) = x(3) 21, x(4) = x(5) =x(6) = x(7) =0。 利用 
图 6.5 可 以 求 出 输出 序列 (由 ， =0,1,…,7。 对 于 N = 8， 需 要 计算 4 个 旋转 因子 ， 即 : 


We=1 
W! = ei — cos(x/4)- jsin(n/4) = 0.707 — j0.707 
Wwe g iS — = -j 
W? =e — 0.707 ~ j0.707 
在 每 个 运算 阶段 后 ， 都 可 求 出 中 间 输 出 序列 ， 
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第 1 级 迭代 
x(0) + x(4) = 1  x'(0) 
x(1) + x(5) 2 1 5 x'(1) 
x(2) + x(6) = 1 c x'(2) 
x(3) + x(7) = 1 > x'(3) 
[x(0) - x(4)]W? = 1 > x'(4) 
fx(1} - x(5)]W! = 0.707 ~ j0.707 — x'(5) 
[xQ) - x(6)]W* = -j > x'(6) 
[x(3) ~ x(7) JW? = -0.707 — j0.707 — x'(7) 


其 中 x(0), x(1),…, Xx( 四 为 第 1 级 选 代 输 出 的 中 间 序 列 ， 也 是 第 2 级 选 代 运 算 的 输 人 序列 。 


第 2 级 选 代 


x'(0) + (2) =2  x"(0) 

x (1) 4 x(3) =2 2 x"(1) 

Ix (0) ~ /(2)]W* = 0 > x"(2) 

[x (1) - x (3) |W? 0 2 x^(3) 

x (4) + x (6) $1—j — x^(4) 

x'(5) + x'(7) = (0.707 — 70.707) + (-0.707 - j0.207) = -j1.41 > x"(5) 
[x (4) - x'(6]W? = 1 + j > x"(6) 

[x (5) - (DW? = -j141 2 x^(7) 


第 2 Rie te PFI x" (0), xD x" (7), CERES 3 级 选 代 的 输 人 序列 。 


第 3 级 迭代 

X(0) =O0) + (LD) =4 

X(4) = x"(0) - x"(1) =0 

X(2) = x"(2) + x'(3) =0 

X(6) = x"(2) - x"(3) - 0 

X(1) 2 x"(4) + x°(5) = (1 - ) + (141) = 1 ~ j2.41 
X(S) = x"(4) - x"(5) = 1 + 70.41 

X(3) = x"(6) + x"(7) = (1 + j} + (1.41) = 1 — j041 
X(T) = x"(6) - x") 21 4 2.41 


我 们 下 在 使 用 符号 X 作 为 最 后 的 输出 序列 ，X(0), X), X07) 构 成 最 终 扰乱 的 输出 序列 ， 


结果 可 以 利用 MATLAB 来 验证 ， 和 参见 附录 D。 后 面 我 们 将 介绍 怎样 进行 重新 排序 以 及 画 出 输出 
幅度 谱 。 


练习 62 16 点 的 FFT | 
假定 输 和 人 矩形 序列 x(0) = x(1) =…=x(7) = 1, x(8) = x(9) =…=x(15) =0。 利用 图 66 的 16 


点 流 图 ， 可 以 求 出 输出 序列 。 每 级 的 中 间 输 出 结果 可 用 练习 6.1 类 似 的 方法 求 出 。N = 168, 8 
要 计算 8 个 旋转 因子 Wo Wi... W^, 


检验 如 图 6.6 所 示 的 扰乱 输出 序列 X， 重 新 对 它们 进行 排序 , 求 出 幅度 谱 。 检 验 图 6.7 所 示 的 


图 形 ， 它 是 一 个 sinc 函数 。 输 出 XX(8) 表示 在 秦 杜 斯 特 频 率 处 的 幅度 值 。 这 些 结果 可 用 MATLAB 
进行 校 验 ， 参 见 附 录 D- 
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图 67 16 点 FFT 幅度 谱 


64 “时间 抽取 的 基 2 FET 算法 


频率 抽取 法 (DIF) 是 将 输出 序列 分 解 成 较 小 的 子 序列 ， 而 时 间 抽 取 法 (DIT) 却 是 将 输 人 序 
列 分 解 成 较 小 的 子 序列 。DIT 将 输入 序列 分 解 成 伪 数 和 奇数 两 个 序列 ， 即 ; 


x(0), x(2), x(4), ..., x(2n) 


和 . 
x{1), x(3), x(5), ---, x(2n + 1) 
代入 式 (61), 可 得 ; 
(NÍ2-1 (N/2)-1 T 
X(k)- g x(22)W 2 十 $ x(2n* 1)W +k (622) 
将 WE = Wy RAK (622) 中 ,可 得 : 
(N/2)-1 (N/2)-3 
X(k)- S x(2n)W a + Ws 5l x(2n+ W (6.23) 
n») net i 
EREM 个 Ni2 点 的 DET, $: 
(N21 
C(k)- g x(2n) Wih (6.24) 
w/z 
D(k) = $ X(2n + DW (625) 
nad 
则 式 (6.23) 中 所 (向 可 以 表示 为 ， 
X (k} = C(k) + WA DIK) (6.26) 


为 了 满足 k > (N/2) - 1 的 要 求 ， 式 (6.26) 需要 进行 变换 。 利 用 式 (65) 施 转 常数 的 对 称 性 ， 
BIW? = _W*， 可 得 : 


X(k-N/2)-C(k)-W*D(k)  k-0,1.., (2-1 (627) 
例如 ， 对 N 28, 3 (6.26) 和 式 (6.27) 变 成 ， 
X(k-C()WD() kz012,3 (628) 
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X(k+4)= C(k) -WD(k) k=0,1,2,3 (6.29 ) 


图 6.8 显示 了 用 时 间 扫 到 方法 将 8 点 的 DET 分 解 成 两 个 4 点 的 DPT 过 程 ， 分 解 或 抽取 过 程 
重复 进行 下 去 ， 直 到 每 4 个 点 的 DFT 分 解 成 两 个 2 点 的 DFT， 如 图 .6.9 Sax, MARDER, 
最 后 分 解 为 Ni2 个 2 点 的 DFT. 





图 6.9 H DIT, 两 个 4 点 的 DEFT 分 解 成 4 个 2 点 DFT 


图 6.10 显示 了 按时 间 抽 取 的 8 点 FFT 的 流 图 ， 从 图 6.10 中 可 以 看 到 输入 序列 是 扰乱 的 ， 这 
与 按 频 率 抽取 得 到 的 输出 序列 万 (名 的 扰乱 方式 是 一 样 的 。 当 输入 序列 x(n) 扰乱 后 ,输出 序列 也 如 
就 变 成 了 自然 顺序 。 采 用 按时 间 抽 了 荫 DIT 或 按 频 率 抽取 DIF 的 方法 来 计算 FFT 得 到 的 结果 都 是 
一 样 的 ， 图 6.10 给 出 了 另 一 种 DIT 流 图 ， 输 人 序列 是 自然 序列 ， 而 输出 序列 是 扰乱 的 。 

下 面 的 练习 说 明了 采用 DIT 方法 计算 8 点 FFT 的 过 程 , 计算 结果 与 练习 6.1 用 DIF 方法 计算 


的 结果 是 一 致 的 。 | 
5&2]6.3 按时 间 摧 取 的 8 A FET . . 
假定 使 用 和 练习 6.1 中 一 样 的 矩形 序列 x(m) 作为 输入 序列 , 利用 图 6.10 的 DIT 流 图 , 得 到 与 

练习 6.1 相同 的 输出 序列 Xi。 旋转 常数 与 练习 6.1 是 一 样 的 ， 但 注意 旋转 常数 W FURISE — 

$ ( 而 不 是 第 一 项 Jo l i l 
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x0} 
x4) 
x(2) 
x(6) 
(1) 
x5) 
x3) 
xi?) 





Æ 6.10 时 间 抽 取 8 点 的 PET 流 图 


第 1 Sn 
x(0) + W°x(4) 21 +0=1  x'(0) 
x(0) - W°x(4) 21-021 > x'(4) 
x(2) + W°x(6) - 10-12 x'(2) 
x(2) — W°x(6) 21-021 — x'(6) 
x(1) + W°x(5) 21021 5 x'(1) 
x(1) - W°x(5) 21-021 => x'(5) 
x(3) + Wx(7) 2140219 x'(3) 
x(3) - Wx(7) = 1-0=1 > x(7) 


其 中 序列 x 表示 第 1 级 选 代 的 输出 序列 ， 也 是 第 2 级 选 代 的 输 和 序列。 


第 2 级 选 代 

x'(0) + Wx'(2) 2141225 x"(0) 

x (4) + WO «14 (7j) -1-j > x"(4) 
x0) - Wr) 21-120 > x2) 

x (4) - WO -1- (-) 214 j 2 x"(6) 
XO) + WB) 2141-25 x"(1) 

x(5) + WD =14 (-(0 21-j  x'(5) 
x(1) - Wx'(3) 21-1205 x"(3) 

x(5) WAND 21- C30) 214j  x"(7) 


其 中 序列 x 是 第 2 级 迭代 的 输出 序列 ， 也 是 第 3 级 选 代 的 输入 序列 。 


第 3 级 迭代 

X(0) = x"(0) + W*x"(1) = 4 

X(1) = x"(4) + W'x"(5) = 1 — j2.414 
X(2) = x"(2) + W423) = 0 

X(3) = x"(6) + W*x"(7) = 1 - 70.414 
X(4) = x"(0) - W*x"(1) =0 

AX(5) = x"(4) - W!x"(5) = 1 4 70.414 | 
X(6) = x”(2) - W*x"(3) =0 

X(7) = x"(6) — W*x"(7) = 1 + j2.414 


可 匈 ， 其 输出 序列 与 练习 6.1 是 相同 的 。 
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6.5 位 反 转 排序 方法 


位 反 转 过 程 是 对 扰乱 的 序列 进行 重新 排序 。 为 了 证 明 这 种 方法 的 正确 性 ,， 取 六 =8， 用 3 候 
位 表示 ， 将 首 末 位 进行 反 转 。 例 如 ，(100)。 FEW (001),, FAH (100), 作为 X(4) 的 地 址 ， 反 转 
成 X(1) 的 地 址 (001), 。 同 样 地 , (110% 反 转 为 (001),, BT X(G) 的 地 址 与 XQ) 的 好 址 进行 互 换 ， 
6.5 DIF 的 输出 序列 和 图 6.10 DIT 的 输 人 序列 可 按 这 种 方法 重新 进行 排序 。 

位 反 转 方法 可 应 用 于 丸 值 出 较 大 时 ,例如 AN = 人 4 可 用 6 个 位 表示 ， 只 需 将 第 1 个 和 第 6 个 位 
相互 反 转 ， 第 2 个 和 第 5 个 位 相互 反 转 以 及 第 3 个 和 第 4 个 相 五 反 转 即 可 。 

本 章 将 举 用 个 使 用 这 种 排序 算法 的 例子 ， 说 明 FFT 算法 规则 。 


6.6 34 FFT 算法 


基 4 算法 能 提高 FFT 的 运算 速度 。 关 于 FFT 算法 ， 已 经 开发 了 按 高 阶 基 和 分 裂 基 FFT 算法 
BF. 我 们 用 频率 抽取 法 DIF 的 分 解 过 程 来 介绍 基 4 FFT 算 法 。 基 4 算法 的 最 后 或 最 低 的 分 解 包 
含 4 个 输入 和 4 个 输出 。FET 的 阶 数 或 长 度 是 4 ，j 是 级 数 。 例 如 ， 对 16 点 的 FFT， 只 需要 两 
级 ， 而 对 基 2 算法 来 说 就 需要 4 级 。 式 (6.1) 的 DFT 分 解 成 4 项 的 和 ， 而 不 是 两 项 的 和 ， 如 
X (6.30) 所 示 : 


(Nja (NA 
X(b)- $ x(n)W"* + 
=) 


n 


=l (3N}4)-1 N-i 
x(p)W"* + $ X()W"* + > x(w (6,30) 
n Nid 


n=N j4 =N/2 amj 


分 别 用 # =n + NIA n =n ND n =n + INARA n, MR (630) 可 以 表 


(N/4)-1 (N/4)-1 
X(k)- $ x(n)W^* + w^" $ x(n-- N/4W^* 
nz ft) 


(NA (Nja-1 (631) 
+ wen $ x(n-- N/2)y"* + WN S x(n+3N/ JW — 
=} = 


Em 4 个 Ni4 点 的 DET, 利用， 
WHE as (gr PANNE L pinh (Cay 
WEN? = gdm = cy 
wo — g 
x (6.31) 变 成 : 
bl AK k k 
AS 2, [x +i)" ne N/A) +A)" xim N[2)GY xn 43/4 — (832) 
SWA = Wya, (6.32) 可 写 为 ; 


(Wi-1 
X(4k) = 53 {x(n  x(n N/A) x(n + N/2) x(n+ 3N/AJW;5. (6.33) 
neo 


(Ni4)-1 
X(4k+1)= $ [x(n) - jx(n - N/4) - x(n-- N/2) e jx(n *3N/AJWOW:S, (634) 





第 6 章 ， 快 速 情 里 叶 变换 151 


X(4k+2)= bl Extn} - x(n +N/A) *x(n € N/2)- xn 3N [AW Wet, (6.35) 
na) 

X(4k -3) - bl [x(r)* jxin- N/A) - xin N/2)- jxin4 3N/4)W;" Writs ( 6.36 ) 
n=Q 


其 中 k=0,1,…, (NI4) - 1, I (6.33) 到 式 (6.36) 表示 生成 4 个 4 DET 的 分 解 过 程 。 图 6.11 

给 出 了 基 4 的 16 点 频 域 抽取 的 EFT 流 图 , 注意 流 图 中 的 4 点 蝶 形 图 。 +A- 在 图 6.11 PRA R 
示 出 来 ， 流 图 的 结果 用 于 下 面 的 练习 中 。 

1 x(0) 第 1 级 Wo 2 325 

1 x(1) 

1 x(2) 

.1 x{3} 

1 x(4) 

1 x(5) 

1 x(6) 

1 x{7) 

0 x(8) 

0 x(9) 

0x(10) EA 

0x(12) 4Z 

0x(12) £ 

0x(13) É 

ox(14) & 

O x(15) 4 


—— MÀ 





图 6.11 和 使 用 频 域 抽取 的 16 点 基 4 FFT 流 图 
656.4 340016 5 FFT 
给 定 如 练习 62 的 一 个 矩形 输入 序列 x(n)， 序列 x(0) = x(1) =…=x(7D) 2 1, x(8) = x(9) 
== x(15) = 0 ， 利 用 图 6.11 的 基 4 算法 流 图 求 出 16 点 FFT 的 输出 序列 ， 所 用 到 的 旋转 常数 如 
$ 6.1 所 示 。 


6.1 基 4 的 16 点 FFT 旋转 常数 


213 
3 
(B 


1 


1 "0.9238 — 0.3826 E 
2 0.707 — j0.707 -1 
3 0.3826 — j0.9238 +j 
4 0-j i 

5 —0.3826 — 0.9238 -j 
6 ~0.707 — j0.707 -i 


- 


-0.9238 — 70.3826 - +f 
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第 ! 级 选 代 的 输出 序列 如 图 6.11 所 示 。 例 如 下 面 的 输出 序列 : 


[x(0) + x(4) + x(8) + x(12)]W 211404022 — x (0) 
BD +26) + x0) + x(13) JW =1+1 +0+0=2> x0) 


pg- jx(4) — x(8) + jx(12)]W 21-;j-0-021-j >x '(4) 


[x(3) — x(7) + x(11) - x(15)]W$ 20 => r1) 
ko + jx(4) - x(8) - ix(12]W? = 1 +j -0-0=1+j >x “(12) 


b) + A) - x(11) - jx(15)]W = [1 + 7-0-0] Wi) 
= -1.307 - j0.541 ~> (15) 
第 2 级 选 代 之 后 的 输出 序列 如 下 所 示 : 
X(3) = (1 +j) + (1.307 — j0.541) + (-/1.414) + (307 ~ j0.541) = 1 - 71.496 


X(15) = (1 + j)(1) + (1.307 — j0.541) 7j) + (/1.414)(1) 
+ (71.307 - j0.541)(-j) = 1 + j5.028. - 

58 B9] X(0), X(1),---, (15) 和 图 6.6 rh3& 2 HY 16 点 FET 输出 结果 是 一 样 的 ， 同样 可 以 利 
用 MATLAB 来 检验 输出 结果 ， 参 见 附录 D, 

输出 序列 次 序 扰乱 了 ， 需要 进行 重新 排序 。 和 基 2 运算 中 的 位 反 转 _ 样 ， 排序 可 用 数字 反 转 
方法 来 实现 。 基 4 (4 为 基 ) 用 数字 0, 1, 2,3. 如 ZC8) 和 XX(2) 的 地 址 需要 交换 ， 因 为 以 10 为 基 或 
者 说 十 进 制 的 (8)wo 相当 于 以 4 为 基 的 (20),, 数字 0 和 1 位 置 调换 就 变 成 以 4 为 基 的 (02),， 相 当 
于 十 进 制 的 (02)ho。 

虽然 混合 或 者 更 高 的 基 在 计算 上 可 以 更 简单 ， 但 编程 问题 也 变 得 比较 复杂 ， 所 以 基 2 算法 仍 
被 广 证 地 使 用 ， 其 次 是 基 4 算 法 。 


6.7 "DISSI S 
离散 傅 里 叶 道 变换 CIDET ) 将 频 域 中 序列 X[K) 转换 成 相应 的 时 间 序 列 x(n)。 定 义 为 : 
x(n) = x x n-0,1,-, N-1 (637) 
将 式 (6.37) MA (6.1) 的 DFT 公式 进行 比较 ， 可 以 看 出 前 面 介绍 的 FFT GE, RER 


两 个 地 方 ， 就 可 用 来 求 快 速 傅 里 叶 北 变换 ( IFFT ): 


1. 增加 比例 因子 YA ; 
2. HW mys EE W, 


通过 这 些 收 改 ， 可 用 癌 样 的 FFT 流 图 来 求 快速 傅 里 叶 逆 变 换 。 下 面 同 样 用 程序 例子 来 说 明 
FFT 的 着 变换 。 

FFT 算法 的 变种 ， 如 快速 哈 特 雷 算法 (FHT )， 可 以 很 容易 从 FFT 算法 推导 出 来 。 反 过 来 ， 
FFT 算法 也 能 从 FHT 算法 推导 出 来 。 有 关 快 速 哈 特 雷 变换 算法 流 图 的 画 法 以 及 8 点 和 16 点 的 快 
速 哈 特 雷 变 换 ， 可 参见 文献 7， 
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练习 65 8 A FFT 

将 练习 6.1 中 得 到 的 输出 序列 于 0) = 4, X(1) 2 1 7 72.41,---, X(7) = 1 + j2.41 作为 8 点 IFFT 
流 图 的 输 人 序列 ， 再 做 上 述 的 两 个 修改 ( 增加 定 标 系数 和 多 ASHE), 由 8 点 的 FFT 流 图 (前 向 ) 
得 到 与 图 6.5 相似 的 8 点 IFET C Ii] ) 流 图 , 检验 输出 序列 是 否 为 练习 6.1 的 输入 矩形 序列 x(0) = 1, 
x(1) = 1,-++, x(7) = 0. 


6.8 编程 举例 


例 6.1 用 CCS 窗口 显示 实数 序列 的 DFT 
该 讽 说 明了 交点 序列 的 离散 传 里 叶 变换 DFT， 图 6.12 给 出 了 实现 DET 的 程序 DFL 输入 
序列 为 xtn)， 程 序 按 照 下 式 进行 计算 ;: 


X(k) = DET(x(n)} = Y x(n)" k=0,1°°,N-1 
r= 


其 中 旋转 因子 W = es 。 上 式 可 分 解 成 实 部 和 虑 部 分 别 计算 ， 即 ; 





Re{X(k)} = y x(n) cos(2nnk/ N) 


IMIX(I)) = F xn) sinnnk/ N) 


使 用 具有 整数 周期 m 的 实数 序列 ,对 于 所 有 的 上 , 除了 大 = mf k= N - mA, X() 不 为 0， 
REX) = 0. 
建立 工程 DFT, 输入 序列 x(n) 为 N = 8 个 数据 点 的 余弦 。 为 了 检验 输出 结果 ， 进 行 如 下 操作 ; 


1. 选择 菜单 View 一 Watch Window, 插 人 了 和 out 两 个 表达 式 ( 右 击 Watch 窗口 ) 点 击 Hout， 
打开 徐 口 ， 观 察 分 蜀 表示 实 部 和 虚 部 的 out[0] 和 out[1]. 


2. 在 DFT 函数 调用 后 面 的 括号 } "处 设置 一 个 断 点 。 


3. 选择 菜单 Debug 一 Animate〈 其 速度 可 利用 选项 调整 )。 检 验 实 部 值 out[0] 在 j= 1 时 ， 它 
的 值 大 (为 3996), 而 在 j=7 时 , 它 的 值 小 。 A m=1, 且 x(m) 是 单 周 期 序列 。 点 数 N= 8, 
HM TE j= m=) 和 j=N-m=7 处 。 下 面 两 个 MATLAB 命令 可 以 检验 这 些 结果 [ 参 
见 附 录 D) 

x = [1000 707 0 -707 -1000 -707 0 707]; 

y = fft(x) 

注意 表 中 的 数据 是 有 舍 入 和 会 出 的 ( 尖峰 最 大 值 是 3996， 不 是 4000), BUSES. 
虚 部 out[1] 为 0 ( 很 小 )。 在 实际 应 用 中 ， 通 常 F.=8 kHz, 生成 的 信号 频率 是 f= 上 x 周期 
UN = 1 kHz。 

， 使 用 有 20 个 数据 点 两 个 周期 的 正弦 数据 表 作 为 输入 x(n)。 在 程序 内 ， 把 NN 改 成 等 于 20, 
FATE RBIS a) BERR SA Ze (第 一 次 输入 ), 必用 正弦 表 作为 输入 , 重建 程序 , 再 进行 仿真。 
检验 当 j=2 时 ， 有 一 个 较 大 的 负 值 (C710 222), 而 在 j=N -m=18 时， 有 一 个 较 大 的 正 
值 (10 232) 实际 应 用 中 ,可 求 出 大 = 0, 1… 时 XOR YF = 8 kHz 时 ， 生 成 对 应 的 
信号 频率 f= 800Hz, 
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//DFT.c DFT of N-point from lookup table. Output from watch window 


#include <stdio.h> 
#include <math.h> 


void dftí(short *x, short k, int *out); 


#define N 8 
float pi - 3.1416; 


//function prototype 
//number of data values 


short x[N] = (1000,707,0,-707,-1000,-707,0,707); //l1-cycle cosine 


//short x[N]-(0,602,974,974,602,0,-602,-974,-974,-602, 
ff 0,602,974,974,602,0,-602,-974,-974,-602}; //2-cycles sine 


int out[2] = (0,0); 


void dft(short *x, short k, int *out) 


{ 

int sumRe = 0 
int sumIm = 0; 
int i - 0; 
float cs = 0; 
float sn = 0; 


for (i = 0; i < N; i++) 
{ 
cs = cos(2*pi*(k)*i/N); 
sn = sin(2*pi*(k)*i/N); 
sumRe = sumRe + x[i]*cs; 


sumim = sumIm - x[i]*sn;. 


} 
cout[0] = sumRe; 
out[1] = sumim; 


} 

void mainí) 
1 

‘int j; 


for (j = 0; j < N; j++) 
{ 
dftíx,j,out); 
) 
} 


//init Re and Im results 
//DFT function 


//init real component 
//init imaginary component 


//init cosine component 
/finit sine component 


//for N-point DFT 
//real component 


/ {imaginary component 
//sum of real components 


.//sum of imaginary components 


//sum of real components 
//sSum of imaginary components 


//call DFT function 


ee 
612 用 查找 表 数 据 作 为 输入 的 DET 实现 程序 (DET) 
例 6.2 利用 CC 语言 FFT 函数 实现 实时 输入 信号 的 EFT 


6.13 给 出 了 实现 外 部 输入 信号 的 256 点 FET 程序 FFT256c.c， 它 汕 用 了 通用 FFT 的 C 语 
言 函 数 FFT.c ( 在 辅助 材料 中 ) 文献 13 和 文献 4 介绍 了 这 个 和 C31 DSK 以 及 C30 EVM 一 起 使 


用 的 FET 函数 。 
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//FFT256C,c FFT implementation calling C-coded FFT function 


#include <math.h> 

#define PTS 256 

#define PI 3.14159265358979 
typedef struct (float real, imag; } 
void FFYT{COMPLEX *Y, int n); 
Boat iobu£ffer[PTS]; 

float xl[P?TS]; 

short i; 

short buffercount - 0; 

short flag - Q0; 

COMPLEX w[PTS]: 

COMPLEX samples[PTS]: 


main {} 

{ 

for 
{ 
w[i].real = cos(2*PI*i/512.0); 
w[il.imag --siní(2*PI*i/512.0); 
} 

comm intr(): 


l«PTS ; i++) 


while(1) 
{ 
while (flag == 0) ; 
flag = 0; 
for (i = 0 ; 


i < PTS ; i++} 


samples[il.real-iobuffer[i]; 


lobuffer[i] = xl[i]; 

for (i = ; i « PTS ; i++) 
samples[i].imag = 0.0; 

FFT {samples, PTS); 

for (i = 0 ; i < PTS ; i++} 


{ 
xl[i] 


+ 


} 
x1f[0] = 
} 
} 


32000.0; 


interrupt void c, intllí) 


i 


output, sample( (int) (iobuffer[buffercount])); 
iobuffer[buffercount44]- (float) (input, sample()):; 


if (buffercount »- PTS) 
{ 
buffercount = 0; 
flag = 1; 
} 
} 


//* of points for FFT 


COMPLEX; 

//FFT prototype 

//as input and output buffer 
//intermediate buffer 

//general purpose index variable 
/fnumber of new samples in iobuffer 
//set to 1 by ISR when iobuffer full 
//twiddle constants stored in w 
//primary working buffer 


// set up twiddle constants in w 


//Re component of twiddle constants 
//Im component of twiddle constants 


//init DSK. codec, McBSP 


/finfinite loop 

//wait until iobuffer is full 
//reset flaq 

//swap buffers 


data 
to iobuffer 


//buffer with new 
//processed frame 
//imag components = 0 
//call function FFT.c 


//compute magnitude 


sqrtisampies[il.real*samples[i].real 
samples[ij.imag*samples[i].imag)/32; 


//negative spike(with AD535)for ref 
//end of infinite loop 
//end of main 


//ISR 


//out from iobuffer 
//input to iobuffer 
//if iobuffer full 


//reinit buffercount 
//set flag 


eee 
图 6.13 调用 CC 语言 FFT 函数 的 实时 输入 FFT 程序 ( FFT256c.c ) 
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旋转 常数 W 在 程序 内 计算 。 为 了 说 明 实 现 过 程 , 输 人 信号 的 虚 部 设 成 0。 由 FFT 结果 得 到 幅 
度 谱 ( 经 过 定 标 )， 这 些 值 再 输出 到 编 解码 器 。 在 此 过 程 中 ， 使 用 了 下 面 三 个 存储 缓冲 区 ， 


1. samples， 存 储 需 要 变换 的 数据 ; 
2. iobuffer， 接 收 输 和 人 抽样 数据 并 输出 处 理 后 的 教 据 ; 
3. x1, FRE FFT 处 理 并 经 过 定 标的 幅度 谱 值 。 


每 个 抽样 周期 产生 一 次 中 断 。 在 每 次 中 断 时 ， 缓 冲 区 iobuffer 输出 一 个 数据 给 编 解码 器 的 
DAC， 同 时 将 一 个 新 输入 数据 存 到 同样 的 缓冲 区 中 。 该 缓冲 区 的 指针 〔buffercount ) PORE, 
表示 它 是 否 已 满 。 如 果 该 缓冲 区 是 满 的 ， 数 据 将 被 复制 到 另 一 个 缓冲 区 samples 中 ， 这 些 数据 在 
调用 FFT 函数 时 需要 用 到 。 保 存在 缓冲 区 x1、 已 经 FFT 处 理 及 定 标 后 的 幅度 谱 什 现在 可 以 复制 
到 VO 缓冲 区 iobuffer 中 作为 输出 。 在 淡 波 竺 法 中 ， 每 采集 一 个 新 数据 就 要 进行 一 次 处 理 ， 伍 在 
FFT 算法 中 ， 只 有 当 FFT 算法 要 求 的 整 帧 数据 全 部 到 来 时 ， 才 能 进行 FET 处 理 。 

建立 并 运行 工程 FFT256c, 输入 一 个 幅度 近似 为 0.5V 到 1V ZcIRHE) 2 kHz 正弦 信和 号 , 614 
给 出 了 经 FFT 变换 后 幅度 谱 的 时 域 波形 ， 该 波形 是 利用 HP 动态 信号 分 析 仪 得 到 的 (也 可 以 使 用 
示波器 o ME 6.14 可 以 看 出 : 两 个 负 人 尖峰 相隔 256T = 32 ms， 它 也 表示 抽样 频率 下 。 第 一 个 正 
尖峰 对 应 2 kHz 处 ( 在 对 应 4 kHz 的 两 个 尖 蜂 中 间 ), 第 二 个 正 尖 峰 对 应 于 折 秋 频率 Ff=6 kHz. 
增 大 输 和 人 信号 频率 ， 观 察 两 个 尖峰 向 4 kHz 的 泰 夸 斯 特 频率 外 靠拢 。 
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图 6.14 ”表示 实时 输入 FFT 幅度 谱 的 时 域 图 


练习 63 使 用 TI 的 C 可 调用 FFT 本 数 ， 求 由 表 输 入 的 正弦 信号 的 FFT 

6.15 给 出 了 FFTsinetable.c 程序 ， 该 程序 说 明了 如 何 用 C 程序 调用 TI 公司 的 泽 点 FET P8 
数 cffir2_dit.sa， 该 隙 数 可 从 TI 公司 的 网 站 上 获得 。 旋 转 常数 是 在 程序 内 计算 的 。 按 照 FFT 函数 
的 要 求 ， 旋 转 常数 的 翰 部 要 进行 取 反 。FET 函数 同时 假定 有 2 个 复 旋转 常数 。 在 存 傅 缓冲 区 中 ， 
数据 对 齐 (以 8 个 字 节 为 单位 ) 是 非常 重要 的 , 输入 数据 和 旋转 常数 都 是 复数 。 

表格 中 的 正弦 数据 作为 输入 信号 实 部 ， 虚 部 设 为 0。 根 据 FFT 函数 的 要 求 ， 输 人 数据 在 存储 
器 中 连续 排 成 实 部 和 虚 部 数 对 ， 输 出 结果 也 是 复数 。 
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//¥PTsinetable.c FFT(sine)from table. Calls TI float-point FFT function 


#include <math.h> 


#define N 32 //number of FFT points 
#define SORT_N 32 //SQRT N >= SQRTIN) 

#define FREQ 8 //* of points/cycle 

#define RADIX 2 //radix or base 

fdefine DELTA (2*PI)/N //argument for mgine/cosine 
#define TAB PTS 32 //* of points in sine table 


$defüne PI 3.14159265358979 
short i - 0; 


short iTwid[SQRT N]: //N/2 + 1 > Eqrt(N) 

short iData[N]: //index for bitrev X 

float XmagIN]:; //magnitude spectrum of x 
typedef struct Complex tag {float re, im: }Complex; 

Complex W[N/RADIX]: //array for twiddle constants 
Complex x(N]; : //N complex data values 


#pragma DATA ALIGN (W, sizeof (Complex) } //align boundary size complex 


short sine table[TAB PTS] - (0,195,383,556,707,831,924,981,1000, 
981,8524,831,707,556,383,195,-0,-195,-383,-556,-707, -831,-924, -981, 
-1000,-981,-924,-831,-707,-556, -383,-195}; 


void main(í) 

( 

for{ i = 0 ; i « N/RADIX ; i++ ) 
{ 


W[i].re = cos (DELTA*i); //real component of W 
W[i].im = sin(DELTA*i); //neg imag component 
} /fsee cfftr2 dit 


for( i = 0 ; i « N ; i++} 


x[il.re-3*sine table[FREQ*i % TAB PTS]; //wrap when i-TAB PTS 


x[i].im = 0 ; //zero imaginary part 

} 
digitrev index(iTwid, N/RADIX, RADIX); //produces index for bitrev() W 
bitrev(W, iTwid, N/RADIX); /fbit reverse W 
cfftr2, dit(x, W N ) ; //TI floating-pt complex FFT 
digitrev,index(iData, N, RADIX); //produces index for bitreví() X 
bitrev(x, iData, N); //freq scrambled--bit-reverse X 
for(i = 0 ; i <N ; i++ } . 

Xmag[íi] = sartí(x[i].re*x[i].re*x[i].im*x[i].im ); //magnitude of x 
comm pollí( ) ; //init DSK,codec,McBSP 
whiie (1) //infinite loop 

{ 

output, sampie(32000) ; //negative spike as reference 
for (i = 1; i < N; i++} 

output sample((int)Xmag[i]): //output magnitude samples 
} 


} 
eee 


图 5.15 EA T RERAN FFT BCE ERA MEN FET EUT. ( FFTsinetable.c ) 
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FFT 函数 cfftr2, dit.sa 是 复 输 人 信和 号 时 间 抽 要 基 2 的 FFT 算法 程序 。 两 个 辅助 函数 digitrev_ 
index.c, bitrev.sa 和 复 FFT 函数 一 起 使 用 ， 用 于 位 反 转 ， 它 们 也 可 从 卫 公 司 的 网 站 上 得 到 。FFT 
函数 cfftr2_dit.sa 假定 输入 数据 x 为 自然 颇 序 ， 而 FFT 系数 或 旋转 常数 是 反 序 的 ， 因 此 ， 辅 助 函 
数 digitrev_index.c 用 来 产生 位 反 转 的 索引 指针 值 ，bitrev.sa 实现 旋转 常数 的 位 反 转 。 在 FFT 函数 
调用 之 前 ， 先 调用 这 两 个 责 数 。 这 两 个 位 反 转 的 辅助 文件 再 被 调用 对 扰乱 的 输出 进行 位 反 转 。 

六 是 复 输 入 或 输出 数据 的 个 数 〔 注意 输入 数据 包括 2N 个 元 素 )， 以 便 进行 NN 点 的 FFT 运算 。 
位 反 转 辅助 函数 使 用 函数 SORT. No FREQ 通过 在 数据 表 中 选择 每 个 周期 的 点 数 来 决定 输入 正弦 
数据 的 频率 。 当 FREQ 设置 为 8 时 ， 则 从 表 中 第 一 个 数据 点 开始 ， 每 隐 7 个 数据 点 选 一 个 数据 。 
模 运 算 只 用 做 重新 初始 化 索引 指针 的 标志 。 下 面 4 个 点 是 选择 的 一 个 周期 : 0, 1000, 0 和 -1000。 
例 2.4 演示 了 用 这 种 指针 索引 方案 选择 表 中 不 同 的 数据 点 的 方法 。 

利用 程序 输出 FFT 的 幅度 谱 ， 下 面 一 行程 序 是 输出 语句 ; 


output, sample(32000); 


执行 该 语句 将 输出 一 个 幅度 接近 -1.1V 的 负 尖 峰 脉 溃 { 不 是 正 脉 冲 , 这 是 因为 AD535 编 解 码 器 使 
用 2 的 补 码 格式 和 接近 1.1 V 的 直流 偏 置 )， 抽 样 速率 通过 轮 询 方法 实现 。 

建立 并 运行 工程 FFTsinetable， 两 个 用 于 位 反 转 的 辅助 文件 和 复 FFT 函数 也 需要 添加 到 源 工 
程 文件 中 。 图 6.16 显示 了 结果 的 时 域 图 (通过 HP 动态 信号 分 析 仪 获得 )。 因为 每 个 了 时 间 进 行 
一 次 输出 ，32 点 时 间 间 隔 就 是 327T,, WAE 32 x (0.125 ms)=4ms， 每 4ms 就 重复 一 个 负 尖 峰 。 
这 就 提供 了 一 个 时 间 和 参考， 因为 两 个 负 人 尖峰 的 时 间 间 隔 对 应 着 8 kHz 的 釉 样 频率 ， 时 向 间隔 的 中 
间 对 应 着 4 kHz 的 达 夺 斯 特 频 率 ( FE SORE 2 ms ), 第 一 个 正 尖 峰 出 现在 离 第 一 个 贷 尖 峰 的 1 ms 
Sb, 这 对 应 着 频率 f= FJ4 = 2kHz。 第 一 个 正 尖峰 出 现在 3 ms 处， 对 应 折 礁 频率 F, — f = 6 kHz. 

为 了 在 表 中 选择 8 TERRE, E FREQ 变 汶 4。 检验 输出 是 否 是 一 个 1 kHz 的 信号 (类似 
于 用 示波器 得 到 的 图 6.14), FREQ 秆 为 12 时， 产生 一 个 3 kHz 的 输出 信号; FREQ 1581, TE 
PIG] HH BUPA PESO ( 在 两 个 负 尖 峰 闻 ), 注意 当 频 率 大 于 4 kHz 时 , HEE THH 
这 一 点 , 把 FREQ 改 为 20, 检验 输出 是 否 是 一 个 在 3 kHz 产生 混 秋 的 信号 , 而 不 是 5 kHz 的 信号 。 
如 果 把 FREQ 改 为 4， 输 出 将 是 2kHz 的 混 生 信号 ， 而 不 是 6 kHz 的 信号 。 
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图 6.16 幅度 谱 的 时 域 图 。 用 表格 数据 得 到 2 kHz 输入 数据 ， 利 
用 了 本 公司 的 FFT 函数 求 出 FFT 幅度 谱 ， 再 画 出 其 时 坡 图 
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在 函数 cfftr2_ditsa (由 TI 公司 提供 ) 中 ， 运 行 周期 数 是 这 样 计算 的 ; 
Cycles = ((2N) + 23)10g;(N) + 6 


对 于 1024 点 的 FFT， 运 行 周期 数 为 2071 x 10 + 6 = 20716， 对 应 的 时 间 是 := 20 716 个 时 钟 
周期 /150 MHz =138 ps. 


6.8.1 RAHE 


下 面 的 例子 将 说 明 FFT 在 频 域内 是 如 何 对 信号 进行 处 理 的 , 快速 卷 积 > 只 需要 较 少 的 计算 
B, 且 比 在 时 域内 实现 一 个 多 系数 FIR 滤波 器 可 能 更 准确 。 


例 6.4 利用 TI 公司 的 浮 点 FFIT 次 数 进行 重 本 相 加 的 快速 卷 积 运算 ， 实 现 FIR 滤波 

图 6.17 给 出 了 FIR 滤波 器 的 程序 fastconvo.c, 并 说 明了 重 释 相 加 的 快速 卷 积 算法 1820.。 开 浮 
点 FFT 支持 函数 有 bitrevsa, digitrev_index.c 和 cffir2_dit.sa, 3X26 AXE ZEA 6.3 中 介绍 过 , 此外， 
这 里 还 使 用 了 复 FFT SE RAR icfftr2_dif sa ( 频率 抽取 DIF 基 2 )， 该 函数 要 求 输入 序列 顺序 是 
扰乱 的 或 经 位 反 转 的 ， 因 此 复 FFT 函数 cfftr2_dit.sa 的 输出 序号 无 需 百 进行 位 反 转 ， 这 样 在 FFT 
变换 之 后 就 不 需要 反 转 支持 文件 digitrev_index.c 和 bitrev.sa T, SE ( 抽样 ) 和 汇 波 器 的 系数 的 
序号 都 是 位 反 转 的 ， 可 以 按 这 种 顺序 相 滋 。 

建立 工程 Fasteonvo (使 用 -ol 编译 优化 级 别 选 项 )， 从 文件 coeffs.h 中 读 出 时 域 滤波 器 系数 ， 
检验 输出 是 否 是 一 个 2 kHz 的 带 通 滤波 器 。 滤 波 器 系数 与 在 例 4.4 中 介绍 的 BP55.cof 相同 ; 中心 
频率 是 所 /4。 

系数 文件 coeffs.b 的 系数 也 和 LPSS.cof 的 系数 相同 ， 它 表示 截止 频率 为 E/8 的 低 通 滤波 器 ， 
例 4.4 中 也 介绍 过 该 系数 文件 。 编 辑 文件 coeffs h， 实 现 并 检验 该 低 通 滤波 器 。 

在 该 例 中 , 使 用 了 几 个 缓冲 区 ，iobuffer 是 基本 的 输 人 输出 缓冲 区 。 在 每 个 抽样 间隔 , PU 
断 服务 程序 (ISR) M iobuffer 中 读 出 下 一 个 时 刻 的 输出 数据 ， 再 送 到 编 解 码 器 ， 然 后 再 输入 一 
个 新 抽样 。 经 过 PTS/2 个 的 抽样 时 间 间 隔 ，iobuffer 内 有 一 帧 新 的 PTS/2 个 输入 抽样 ， 这 时 flag 
TESI. 

主 程序 使 用 while 循环 语句 ， 等 待 flag 的 变化 : 

while (flag == 0); 

然后 执行 下 面 的 操作 : 


1， 把 标志 flag 复位 为 0。 

2. 把 缓冲 区 iobuffer 的 内 容 (新 输入 抽样 帧 ) 复制 到 缓冲 抽样 存储 器 的 第 一 个 PTS/2 个 缓冲 
单元 。 

3， 把 缓冲 区 overlap HAR (前 面 经 过 计算 的 输出 帧 ) 复制 到 缓冲 区 iobuffer。 

4， 处 理 新 的 输 人 抽样 帧 ， 算 出 下 一 个 输出 抽样 帧 - 


帧 处 理 周期 ( 在 无 限 循环 内 ) 是 PTS/2 个 抽样 周期 ， 期 间 执行 和 包含 以 下 过 程 : 


1， 抽 样 缓冲 区 samples ( 实 部 ) 的 最 后 PTS/2 个 单元 内 容 复制 到 缓冲 区 overlap 中 ， 这 些 时 
域 数据 可 认为 是 前 面 处 理 帧 的 后 半 部 分 的 重 释 (PTS/2 个 抽样 

2. 抽样 绥 冲 区 的 最 后 PTS/2 个 存储 单元 全 部 写 人 0， 这 样 抽样 缓冲 区 内 就 有 PTS/2 个 新 样 
本 ， 后 面 跟着 PTS/2 个 的 补 零 数 据 。 
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3. 对 抽样 缓冲 区 内 的 数据 进行 PTS 个 点 的 FFT 变换 ， 将 时 域 抽样 变 成 频 域 数据 。 

4. 经 FFT 变换 后 的 频 域 数据 ( 复数 ) PRUE n 中 的 复 滤波 器 系数 。 . 

5. 再 利用 PTS 个 点 的 IFFT 变换 将 抽样 缓 神 区 中 的 频 域 数据 逆 变 换 成 时 域 数 据 ， 结 果 PTS 
个 时 域 数据 将 是 实数 。 

6， 抽 样 缓 神 区 前 面 PTS/2 个 单元 的 内 容 (也 就 是 目前 帧 处 理 结 果 的 前 半 部 分 ) DPR 
冲 区 的 内 容 上 去 。 


//FastConvo.c FIR filter implemented using overlap-add fast convolution 


#include <math.h> 


#include “coeffs.h" /f/time domain FIR coefficients 
#define PI 3.14159265358979 

fdefine PTS 256 //number of points for FFT 
#define SQRT PTS 16 //used in twiddle factor calc. 
#define RADIX 2 //passed to TI FFT routines 


#define DELTA (2*PI)/PTS 

typedef struct Complex tag {float real, imag:;) COMPLEX ; 
*pragma DATA, ALIGN(W, sizeof(COMPLEX)) 

#pragma DATA ALIGN(samples, sizeof(COMPLEX)) 

#pragma DATA ALIGN(h, sizeof(COMPLEX)) 


COMPLEX W[PTS/RADIX] ; //twiddle factor array 

COMPLEX 5amples[PTS]: //processing buffer 

COMPLEX h[PTS]; //FIR filter coefficients 

Short buffercount - 0; //bu£ffer count for iobuffer samples 
float iobuffer[PTS/2]; /fprimary input/output buffer 

float overlap[PTS/2]:; . //intermediate result buffer 

short i; //index variable 

short flag = 0; //set to indicate iobuffer full 
float a, b; //variables used in complex multiply 
short NUMCOEFFS = sizeof(coeffa)/sizeot(float); 

short iTwid[SQRT PTS] ; //PTS/2 + 1 > sqrt(PTS) 

interrupt void c intli(void) //ISR 


i 
output sample((int) (iobuffer[buffercount])); 


iobuffer [buffercount++] = (float) (input sample(]); 

if (buffercount >= PTS/2) //for overlap-add method iobuffer 
i /fis half size of FFT used 
buffercount = 0; : 
flag - 1; 
} 

} 

maini) 

{ //set up array of twiddle factors 


digitrev index(iTwid, PTS/RADIX, RADIX); 
for(i = 0 ; i « PTS/RADIX ; i++) 

{ 

W[i].real = cos {DELTA*i); 

W[i].imag = sin(DELTA*i); 
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} 


bitrev(W, iTwid, PTS/RADIX); //bit reverse order W 

for {i = 0 ; i<PTS ; i++) //initialise PTS element 
{ //of COMPLEX to hold real-valued 
h[i].real = 0.0; //time domain FIR filter coefficients 


h[i].imag = 0.0; 


} 
for (i = 0 ; i « NUMCOEFFS ; i++) 


{ //xead FIR filter coeffs 
h[i].real = coeffs[il: //NUMCOEFFS should be less than PTS/2 
} 
efftr2_dit (h, W, PTs); //transform filter coeffs 
comm intrí); //initialise DSK, codec, McBSP 
while(l) //frame processing infinite loop 
( 
while (flag == 0); //wait for iobuffer full 
flag = 0; 
for (i = 0 ; i«PTS/2 ; i++) //iobuffer into first half of 
1 /f5amples buffer 
samplesii].real = iobuffer[i]; 
iobuffer[i] = overlap[i]; /fpreviously processed output 
} /fto iobuffer 
for (i = 0 ; i«PTS/2 ; i++} 
f /fsecond half of samples to overlap 


overlap[i] = samples[i-PTS/2].real: 
samples[i-PTS/2].real = 0.0; //zero-pad input from iobuffer 


} 
for (i=0; i«PTS ; i++) - 
samples[i].imag = 0.0; //init imag parts in samples buffer 
cfftr2 dit(samples,W,PTS); //complex FFT function from TI 
for (i=0 ; i«PTS ; i++] //frequency-domain representation 
{ //complex multiply samples by h 
& = sampies[i].real; 
b = samples[i].imag: 


samples[i].real = h[il.real*a - h[i].imag*b: 
samplesfi].imag = h[il.real*b + h[i].imag*a; 
} 


icfftr2_dif (samples,W, PTS); //inverse FFT function from TI 


for (i=0 ; i<PTS ; i++) 
sampleslil.real /= PTS; 


for (i=0 ; i«PTS/2 ; i++) //add first half of samples 
overlap[i] += samples{i].real; ito overlap 
} /f/end of while(i} 
o} //end of maini} 


图 6.17 EMTA FTAA, SCHUBCIE BÜDURE ERUIT: { fastconvo.e ) 
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因为 输入 输出 的 信号 是 实 信号 ， 同样 缓冲 区 iobuffer 和 overlap 也 是 实数 缓冲 区 , 但 是 , 这 些 
信号 的 频 域 是 用 复数 形式 表示 的 ， 抽样 缓冲 区 和 滤波 器 系数 数组 h 是 复数 形式 的 ， 每 个 抽样 需要 
两 个 浮 点 值 ( 分 别 表 示 实 部 和 虚 部 2. 

快速 有 效 的 缓冲 方法 是 使 用 指针 ， 而 不 是 将 数据 从 一 个 缓冲 区 复制 到 另 一 个 缓冲 区 ， 但 后 者 
比较 直接 、 清 晰 明了 。 


仿真 的 其 他 程序 版 本 

程序 fastconvosim.c ( 在 辅助 材料 中 ) 是 fastconvo.c 非 实时 的 版 本 程序 , 该 程序 对 事先 存 人 的 
输入 抽样 进行 处 理 。 在 程序 中 的 特定 位 置 设置 断 点 ， 用 户 可 在 重重 相 加 处 理 部 分 的 多 个 阶段 单 步 
执行 程序 ， 观 察 每 步 每 个 缓冲 区 的 内 容 。 图 6.18 给 出 了 在 处 理 过 程 的 中 间 阶 段 (用 CCS 得 到 )， 
缓冲 区 内 容 iobuffer, h, samples 和 overlap 的 典型 结果 。 


mi 


=i — Mil 





TP -—— - — Fe 


图 6.18 使 用 仿真 程序 fastconvosim.c， 在 中 间 处 理 阶 段 ， 利 用 CCS 
画 出 4 个 缓冲 区 iobuffer，h，samples 和 overlap 的 图 形 
例 6.5 图 形 均衡 器 
图 6.19 给 出 了 graphicEQ.c 的 程序 清单 该 程序 实现 一 个 三 段 图 形 均 衡器 。 在 该 工程 中 , 我 
们 再 次 使 用 了 TI 浮 点 复数 FFT Al IFFT 支持 函数 ( 见 例 6.3 和 例 6.4 ). 
graphicEQcoeff.h 文件 内 有 三 组 系数 : 1.3 kHz 的 低 通 、1.3 kHz 到 2.6 kHz 的 带 通 和 2.6 kHz 
的 高 通 ， 它 们 都 是 利用 MATLAB 的 函数 firl 来 设计 的 。 输入 抽样 和 三 组 系数 都 变 成 频 域 数据 ， 
滤波 是 基于 例 6.4 的 重合 相 加 方法 在 频 域内 实现 的 "”"”。 注 意 复数 乘法 (H)(X) 运 算 公 式 , 这 里 H 
表示 传输 函数 ，X 表示 输入 抽样 ， 相 乘 的 结果 是 : 


(Hy + jH)(Xe + 1X1) = (HrXr — HjXi) + j (HeX; + HiXq) 
程序 中 同样 利用 该 公式 ， 其 中 j=-1。 
中 断 服务 程序 ISR 不 断 地 ( 每 个 抽样 周期 T, ) 从 缓冲 区 iobuffer 中 输出 一 个 值 ， 然 后 输入 一 


个 新 值 ， 直 到 缓冲 区 iobuffer 满 时 为 止 ， 这 时 又 得 到 一 个 新 的 输入 数据 帧 ， 初 始 化 iobuffer 指针 ， 
并 将 标志 flag 置 位 ， 主 程序 等 待 标志 flag 被 置 位 ， 然 后 再 将 它 复位 。 
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//GraphicEQ.c Graphic Equalizer using TI floating-point FFT functions 


#include <math.h> 


#include "GraphicEQcoeff.h" //time-domain FIR coefficients 
#define PI 3.14159265358979 
#define PTS 256 //number of points for FFT 


#define SQRT_PTS 16 

#define RADIX 2 

#define DELTA (2*PI}/PTS 

typedef struct Complex tag {float real, imag;} COMPLEX; 
#pragma DATA, ALIGN(W,sizeof (COMPLEX)) 

#pragma DATA ALIGN (samples, sizeof {COMPLEX} } 
#pragma DATA_ALIGN({h, sizeof (COMPLEX) ) 

COMPLEX W[PTS/RADIX) ; //twiddle array 
COMPLEX samples[PTS); 

COMPLEX h[PTS]; 

COMPLEX bass(PTS], mid[PTS], treble[PTs]; 


short buffercount = (0; //bu£fer count for iobuffer samples 
float iobuffer[PTS/2]; //primary input/output buffer 

float overlap[PTS/2]:; //intermediate resuit buffer 

short i; /f/index variable 

short flag = O0; //set to indicate icbuffer full 
float a, b; //variables for complex multiply 
short NUMCOEFFS = sizeof(lpcoeff)/sizeof(float): 

short iTwid[SORT PTS] ; //PTS/241 > sqrt(PTS) 

float bass gain - 1.0; /finitial gain values 


float mid gain = 0.0 //change with GraphicEQ.gel 


float treble gain = 1.0; 


interrupt void c intllívoid) //ISR 

{ 

output_sample{ (int) (icbuffer[buffercount])}; 
iobuffer[buffercount4«4] = (float) (input_sample{}}; 


if (buffercount >= PTS/2) //for overlap-add method iobuffer 
{ /itis half size of FFT used 
buffercount = 0; 
flag = 1; 
} 

} 

main() 


{ 
digitrev index(iTwid, PTS/RADIX, RADIX); 
for( i = 0; i < PTS/RADIX; i++ ) 


1 

W[i].real = cos{DELTA*i); 

W[i].imag = sin(DELTA*i); 

} . 
bitrev(W, iTwid, PTS/RADIX); //bit reverse W 


for {i=0 ; i«PTS ; i++} 
{ 
bass [i] .real 
bass [i] .imag 
mid[i].real = 
mid[i].imag = 
treble[i].real = 6. 
0 


treble(i].imag = 
} 
for {i=0; i«NUMCOEFFS; i++) //same # of coeff for each filter 
{ 
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bass[il.real = lpeoefffil; //lowpass coeff 
mid[i].real = bpcoeff[il: //bandpass coeff 
treble[ij.real = hpcoeff [il]; //highpass coef 
H 
cfftr2, dit (bass, W, PTS); /ftransicrm each band into frequency 


cfftr2,dit(mid,W,PTS); 
efftr2_dit (treble,W, PTS); 


comm, intri); //initialise DSK, codec, McBSP 
while (1)} /f/frame processing infinite loop 
{ 
while (flag == 0}; //wait for iobuffer full 
flag - 0; 
for (i«0 ; i<PTS/2 ; i++} /fiobuffer into samples buffer 
{ 
samples(i}.real = iobuffer[i]; 
tobuffer[i] = overlaplil: //previously processed output 
} » //to iobuffer 
for [izÜ ; i«PTS/2 ; i++} 
1 //upper-half samples to overlap 


overlapli] = samples[i+PTS/2] .real; 
samplesíi«PTS/2].real = 0.0; //zero-pad input from iobuffer 
} 
for (i-0 ; i«PTS ; i++) . 
samples [i] . imag 0.0; //init samples buffer 


it 


cfftr2_dit (samples, W, PTS); 


for (i=0 ; i«PTS ; i++) //construct freq domain filter 


{ //sum of bass,mid,treble coaffs 
h[i].xreal = bass[il.real*bass gain + miád[i].real*mid gain 

* treble[i].real*treble, gain; 
h{i].imag = bass[il.imag*bass gain + mid[il.imag*mid gain 

+ treble[i].imag*treble, gain; 
} 
for (i=0; i<PTS; i++} //frequency-domain representation 
{ //complex multiply samples by h 

a samples[i].reai; : 


A il 


5 samples[i].imag; 

samples[il.real = hlil.real*a - h[ij.imag*b; 
samples[i].imag = h[il.real*b + h[il.imag*a; 
} 


icfftr2 difí(samples,W,PTS); 


for (i=0 ; i«PTS ; i++) 
samples[i].real /- PTS; 


for (i-0 ; i«PTS/2 ; i++) " //add ist half to overlap 
overlap[i] += samples[ij.real; 
) //end of infinite loop 
} //end of maini) 


图 5.19 $E TI FEA FFT 函数 的 均衡 器 程序 ( grapbicEQ.c ) 


创建 工程 graphicBQ ( 使 用 -ol 优化 级 选项 )， 使 用 语音 文件 ， 如 TheForce.wav ( 参见 例 4.9 ) 
或 噪声 ， 测 试 工程 的 正确 性 。 检 验 低频 和 高 频 分 量 被 提升 了 ， 而 中 频 范 围 频 率 分 量 衰减 了 ， 这 是 
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因为 程序 里 让 波 器 系数 定 标的 缘故 ，bass gain 和 treble_gain 的 初始 值 设 为 1， 而 mid. gain 的 初 
始 值 设 为 0。 清 动 条 文件 graphicEQ.gel ( 在 辅助 材料 中 ) 能 够 狂 立 控制 三 个 频带 。 圈 6.20 给 出 了 
利用 噪声 作为 输入 和 两 个 不 同 的 增益 设置 ， 通 过 信和 号 分 析 仪 获得 的 输出 谱 图 形 。 

atMaG RANGE: -1 dBY STATUSE sr USED 


~1e 
dEVv 













-92 : : DOM à sat Canal 
START: @ Hz BUF 47.742 Hz STOP: 5 688 Hz 
X: 8525 Hz Y1-39.58 BY 

{a} bass gain = treble gain = 1, mid gain = 0 
RANGE? -1 dEV STATUS: PAUSED : 
RMS? 186 
-12 
aby 
10 
dh 
Tv 
-92 Dewi : : _ : 
START! 8 Hz Bit 47.742 Hz STOP: 5 gga Hz 
Hi 2675 Hz 73-44.17 d8V 


(b) bass. gain = treble. gain = 0, mid, gain = 1 


图 6.20 频谱 分 析 仪 测 得 的 图 形 均衡 器 输出 功率 谱 
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第 7 章 HIME a 


本 章 的 主要 内 容 包括 : (1) 自 适应 滤波 器 的 结构 ;( 2 ) 最 小 均 方 (LMS) 算法 ; (3 ) RER 
销 和 系统 辨识 应 用 的 C 语言 程序 实例 。 

自 适 应 滤波 器 最 适用 于 信和 号 或 系统 参数 缓 爆 变化 的 情况 ， 这 时 涉 波 器 自动 调整 参数 ， 以 补 仙 
这 些 参 数 变化 造成 的 影响 。 最 小 均 方 (LMS) 准则 是 一 种 可 用 于 调整 法 波 器 系数 的 搜索 算法 。 本 
章 同 时 给 出 了 一 些 程序 实例 ， 提 供 了 对 自 适 应 滤波 器 基本 的 、 直 观 的 理解 。 


71 3 引言 


对 于 常规 的 FIR 和 IIR 数字 滤波 器 ， 决 定 滤 波 融 特性 的 过 程 参数 是 已 知 和 的， 尽管 它们 可 能 随 
着 时 间 变 化 ， 但 是 这 种 变化 特性 是 先 验 已 知 的 。 在 实际 应 用 中 ,由 于 没有 足够 的 关于 过 程 的 先 验 
数据 ， 因 此 很 多 参数 就 存在 很 大 的 不 确定 性 ， 有些 系数 甚至 可 能 会 随时 间 变化 ， 而 且 确 切 的 变化 
特性 是 很 难 预 测 出 来 的 。 在 这 些 情况 下 ， 人 们 非常 希望 能 够 设计 出 随 着 当时 条 件 的 变化 ， 自 动 地 
调整 参数 的 自学 习 滤波 器 。 

自得 应 滤波 器 的 系数 能 自动 调节 ， 以 补偿 输 人 信号、 输出 信号 或 系统 参数 的 变化 。 自 适应 系 
统 能 了 解 信号 的 特性 ， 跟 踪 组 慢 变 化 的 信号 ， 而 不 是 固定 不 变 的 。 在 未 知 信号 特性 或 信号 特性 随 
着 时 间 变 化 的 场合 ， 自 适应 滤波 髓 是 非常 用 的 。 

图 7.1 表示 的 是 自 适应 滤波 器 的 基本 结 梅 ， 其 输出 y 与 所 期 望 的 信号 a 相 比 较 产 生 一 个 误差 
信号 e， 该 误差 信号 反馈 回 自 适应 滤波 器 。 基 于 误差 信号 ， 运 用 最 小 均 方 (LMIS ) 的 算法 ， 调 整 
或 优化 滤波 器 的 系数 。 





器 7.1 自 送 应 滤波 器 的 基本 结构 


尽管 目前 有 许多 方法 来 实现 自 适 应 滤波 器 ， 但 这 里 我 们 只 讨论 结合 线性 合并 (FIR 滤波 器 ) 
的 LMS 搜索 算法 。 图 7.1 自 适应 滤波 器 的 输出 为 : 


y(n) = Y wy (n)x(n — k) (7.1) 
k=0 


其 中 Wx(m) 表 示 特 定时 刻 n 的 N 个 权重 或 系数 。 在 第 4 章 中 , 式 7.1 的 卷 积 方程 是 结合 FIR 滤波 
器 来 实现 的 。 在 自 适 应 滤波 和 神经 网 络 中 用 术语 权重 w 代替 系数 是 通常 的 做 法 。 
对 于 一 个 滤波 器 , 需要 一 个 性 能 标准 来 决定 滤波 器 的 好 坏 , 通常 性 能 标准 是 基于 误差 函数 的 ， 
e(n) -dín)-y(n) - (72) 
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误差 函数 是 期 望 信号 dn) 与 自 适 应 滤波 器 输出 y(n) 的 差 值 。 调 节 权 重 或 系数 min), ERRE 
的 均 方 值 最 小 。 均 方 误差 函数 是 指 E[e(n] ， 忆 表示 期 望 值 。 因 为 有 上 个 权重 或 系数 ， 需 要 求 均 
方 误差 本 数 的 导数 。 可 以 找到 一 种 估计 方法 来 蔡 代 对 en) 求 导 ， 从 而 得 到 : 

wint wn + Pen kh) k=0,1,.,N-I (7.3) 


上 式 就 是 LMS REO, R (7.3 ) 提供 了 一 种 不 需要 计算 均值 或 求 微分 ， 只 需 调 整 更 新 权重 或 系 
数 ， 从 而 实现 自 适 应 滤波 器 的 简单 且 强 有 效 的 方法 。x(n) 是 自 适应 滤波 器 的 输入 ， 甩 表示 收 化 速 
讼 和 自 适 应 过 程 的 准确 度 ( 自 适应 步 长 ) 

对 了 于 每 个 特定 的 时 刻 n, 如 果 误 差 信 号 e(n) 不 为 0, 就 根据 式 (7.3 ) 替代 或 更 新 权重 或 系数 。 
对 于 一 个 特定 时 刻 mn， 滤波 器 输出 X(m) 后 ， 误 差 信 号 e(n), KERAM (0) 又 被 更 新 ，ADC 
又 获得 一 个 新 抽样 数据 ， 这 种 自 适应 过 程 在 不 周 时 间 不 断 重 复 执行 。 注 意 式 (7.3 ) 中 ， 当 误差 信 
号 e(n) 为 0 时 ,权重 或 杀 数 是 无 需 调 整 的 。 

线性 自 适应 合并 是 一 种 最 有 用 的 自 适应 滤波 器 结构 ， 是 一 种 可 调 的 FIR 滤波 器 。 但 第 4 章 中 
讨论 的 频率 选择 性 FIR 滤波 器 的 系数 是 固定 的 ， 自 适应 滩 波 器 的 系数 或 权重 可 随 环 境 的 变化 而 调 
整 ， 如 输入 信号 的 变化 。 为 了 满足 特定 性 务 的 要 求 ， 也 可 以 使 用 自 适应 VIR 滤波 器 ( 这 里 不 做 讨 
i$) 对 于 自 适 应 OR 滤波 器 来 说 , 最 主要 的 问题 是 在 自 适应 变化 过 程 中 , 它 的 极点 很 可 能 处 于 单 
位 圆 外 ， 从 而 导致 滤波 器 的 不 稳定 。 

下 面 将 使 用 式 (7.1) ~ (7.3) 编写 开发 相应 的 程序 ， 在 式 (73) 中 ， 只 用 变 最 而 不 用 28 。 


7.2 自 适 应 滤波 器 结构 
在 自 适 庶 滤 波 器 设计 中 ， 有 许多 不 同 的 自 适 应 滤波 器 结构 满足 不 同 的 应 用 要 求 。 


|. REE. Bd 7.2 给 出 了 由 图 7.1 改进 的 且 适 用 于 了 蜡 声 抵 销 的 自 适应 滤波 器 结构 。 期 望 信 
导 4 被 不 相关 的 加 性 噪声 ”所 污染 , 自 适 应 滤波 器 的 输入 噪声 与 噪声 s HAE, nA 
n 可 能 来 自 同 样 的 噪声 源 , 但 被 环境 改变 了 。 自 适应 滤波 器 的 输出 y 适应 噪声 信号 的 变化 ， 
这 时 ,误差 信号 接近 于 期 望 信和 号 d, 所 有 的 输出 信和 号 是 误差 信号 ,而 不 是 自 适应 滤波 器 的 
输出 信号 y。 我 们 将 用 C 语言 编程 实例 进一步 说 明 这 种 滤波 器 结构 。 

2. SRÉCHEIR. 图 7.3 给 出 了 用 于 系统 辨识 或 建 模 的 自 适 应 滤波 器 结构 。 相 同 的 信号 输 人 到 未 
知 系统 以 及 与 之 并 联 自 适 应 滤波 器 , 误差 信号 e 是 未 知 系统 输出 4 和 自 适 应 滤波 器 输出 y 
的 差 信 ， 该 误差 信号 反馈 到 自 适 应 滤波 器 ， 用 于 油 整 自 适 应 滤波 器 的 系数 ， 直 到 所 有 的 
输出 y = d。 这 时 自 适应 过 程 结束 ， 而 e 趋 于 0。 在 该 方案 中 ， 自 适应 滤波 器 就 构造 该 未 
知 滤波 器 的 模型 ， 后 面 将 通过 三 个 编程 实例 来 说 明 这 种 结构 。 


dtn 





图 7.2 WiPHutei wn SAT 





$7* BERERE 169 
d 
图 7.3 系统 辨识 滤波 器 结构 
3. 自 适 应 预测 器 。 图 7.4 给 声 了 能 估计 输入 信号 的 自 适应 向 测 器 结构 ， 后 面 将 通过 一 个 编程 
例子 来 说 明 它 。 
4. 其 他 结构 ， 如 ; 
( a) 具有 两 个 权重 的 陷 波 只 ,用 于 消除 或 衰减 一 个 正弦 噪声 信号 , 这 种 结构 只 有 两 个 权重 
系数 ， 图 7 给 出 了 它 的 结构 .文献 834 用 C31 处 理 器 说 明了 这 种 结构 。 
(b) 自 适应 信道 均衡 。 应 用 于 调制 解 调 器 中 ,用 来 减 小 在 电话 信道 中 传输 高 速 数据 引起 


的 失真 。 . 
输入 






+ e 





IN1 = din) ein) 






图 7.4 自 适 应 预 洲 器 结构 
EWA den 





Ser RAS xin) 


图 7.5 两 个 权重 的 自 适 庶 陷 波 器 结构 


LMS 甜 法 适合 于 多 种 应 用 ， 包 括 自 适应 回 波 和 只 声 抵 销 ， 自 适应 均衡 和 自 适 应 预测 等 。 
基于 LMS 算法 , 已 得 到 许多 演变 的 算法 ,例如 符号 -误差 LMS, 符号 -数据 LMS 和 符 导 -符号 
LMS 算法 等 。 


1， 对 于 符号 -误差 LMS 算法 ， 式 (7.3) Aw: 


weln+1)=we(n) +B senle(n)]x(n —k) (7.4) 
其 中 sen 为 符号 函数 : 
[1 HR u0 
ni) ={ 7 如 Rus 0 (7.5) 


2， 对 于 符号 -数据 LMS 算法 ， 式 (73) 变 为 ， 





170 DSP 原理 及 其 CC 编程 开发 技术 


wy (n1) =w (n) + Belt) sgn[x(n —*)] (7.6) 
3， 对 于 符号 -符号 LMS WHE, 3x (073) BH: 
wi (n1) - win) B sgn[e()] sgn[x(n — k)) (73) 


可 化 简 为 : 
v. (net) i (m+B — sgnie(n)]  sgn[x(n - &)] 

Wk (n)-p 其 他 
从 数学 角度 来 看 ， 公 式 变 得 更 简单 了 ， 因 为 该 算法 没有 乘法 运算 。 


这 些 演 变 的 算法 设 有 利用 TMS320C6x 处 理 器 的 流水 线 特 性 。 由 于 包 售 涉及 误差 信号 或 抽样 
数据 符号 测试 的 判决 类 型 指令 ，TMS320C6x 处 理 器 运行 这 些 演变 的 算法 速度 可 能 比 基 本 LMS E 
法 慢 。 

LMS 算法 非常 适合 应 用 于 自 送 应 均衡 器、 电话 的 回音 拯 销 器 等 设备 中 。 其 他 算法 ， 如 递归 最 
AZI (RLS) 算法 由 ， 比 基本 LMS 收 敏 快 ， 担 需要 较 大 的 计算 量 。RLS 基于 最 优化 方案 ， 用 每 
个 输入 样本 来 更 新 冲 激 响 应 以 获得 最 佳 性 能 ， 在 输入 每 个 时 间 抽 样 进行 计算 时 ， 都 需 定义 正确 的 
步 长 和 方向 。 

文献 中 中 介绍 了 用 于 恢复 信号 特性 的 自 适 应 算法 。 当 不 能 获得 合适 的 参考 信号 时 ， 这 些 算法 
是 非常 有 用 的 ,在 实现 自 适应 滤波 之 前 , 滤波 器 会 自 适应 调整 , 以 恢复 信号 壬 失 的 特性 。 和 在 LMS 
和 RLS 算法 中 一 样 , 不 是 利用 期 望 的 波形 作为 模板 ,这 种 特性 用 于 滤波 器 的 自 适 应 调整 。 当 可 以 
利用 期 望 的 信号 时 ,可 使 用 如 LMS 的 常规 算法 ， 否 则 ， 就 需要 信号 的 先 验 知识 了 。 


73 (RPE RAID RR 3 (1 


该 例 介绍 了 使 用 最 小 均 方 (LMS) 算法 实现 自 适应 滤波 的 过 程 ， 即 使 该 例 没 有 使 用 DSK, 阅 
读 它 也 是 有 指导 意义 的 ， 这 是 因为 它 说 明了 自 适应 处 理 的 步骤 。 


例 7.1 用 Borland C/C++ 编译 CC 请 育 程 序 实现 自 适应 滤波 器 
该 Borland CAC++ 编 译 的 马 语 言 程序 例子 采用 了 LMS 算法 ， 它 说 明了 利用 图 7.1 的 自 适 应 绪 
构 实 现 自 适应 滤波 的 过 程 ， 


1， 获 得 一 个 新 抽样 、 期 望 信号 d 以 及 自 适应 滤波 器 x 的 参考 输入 噪声 信和 号。 

2. 与 第 4 章 中 的 FIR 滤波 器 一 样 ， 利 用 式 〈7.1 ) 计算 自 适应 FIR 滤波 器 的 输出 y。 在 图 7.1 
的 结构 中 ， 所 有 输出 与 自 适 应 滤波 器 的 输出 y 相同 。 

3. 利用 式 (7.2) 计算 误差 信号 。 

4. 利用 式 (7.3) 更 新 系数 或 权重 。 

5. 利用 第 4 章 中 的 数据 移动 方案 ， 更 新 下 个 时 刻 n. 的 输入 抽样 数据 。 这 种 方案 移动 数据 ， 
而 不 是 移 动 指针 。 

6. 对 于 下 一 个 输出 抽样 点 ， 重复 整 个 自 适 应 过 程 。 


图 7.6 给 出 了 基于 LMS 算法 实现 图 7.1 自 适应 滤波 器 结构 的 程序 adaptc.c. dS 2 cos(2nmflF.) 
EARRA, sinf F) 作为 自 适 应 滤波 器 的 参考 噪声 输入 ， 其 中 f 为 kHz, F, = 8kHz. 
自 适 应 速率 、 淡 波 器 阶 数 和 抽样 点 数 分 别 是 0.01, 22 和 40, 

所 有 输出 是 自 适应 滤波 器 的 输出 ”>， 该 信号 自 适 应 或 收敛 于 期 望 的 余 疏 信号 d 


(7.8) 
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/fA@apte.c Adaptation using LMS without TI's compiler 


#include <stdic.h> 
#incluge <math.h> 


#define beta 0.01 //convergence rate 
#define N 21 /f/oxrder of filter 
#define NS 40 //number of samples 
#define Fs 8000 //sampling frequency 
#define pi 3.1415926 
#define DESIRED 2*cos(2*pi*T*1000/Fs} //desired signal 
#define NOISE sin(2*pi*T*1000/Fs) //noise signal 
mainí) 
1 
long I, T; 
double D, Y, E; 
double W[N«1] = {0.0}; 
double X[N«1] = {0.0}; 
FILE *desired, *Y out, *error; 
desired = fopen ("DESIRED", "wt-"); //hle for desired samples 
Y out = fopen ("Y OUT", "w--*): //fle for output samples 
error = fopen ("ERROR^, “wt+"); /ffile for error samples 
for {T = 0; T < NS; T++) //start adaptive algorithm 
( 
Xx[0] = NOISE; //new noise sample 
D - DESIRED: //desired signal 
Y = 0; //filter‘output set to zero 
for (I = 0; I <= N; I++} 
Y += (QW[I] * XII]): //calculate filter output 
E-D-Y //calculate error signal 
for (I = N; I >= 0; I--) 
( 
W[I] = W[I] + (beta*E*X[I]): //update filter coefficients 
if (I != 0) 
X(T] = X[I-1]: f iupdate data sample 
1 
fprintf (desired, *\n%10q &l0r", (float) T/Fs, D): 
fprintf (Y out, "Xn&10g *10f", {float) T/Fs, Y); 
fprintf (error, "in*lÜg *10f", {float} T/Fs, E); 
) 
fclose (desired); 
fclose (Y out]; 
fclose (error); 
} 





El 7.6 Borland C/C++ 编译 的 自 适应 滤波 器 程序 ( adapte.c ) 


源 文件 用 Borland C/C++ 编译 器 进行 编译 。 执行 该 程序 ,图 7.7 画 出 了 自 适应 滤波 器 输出 (yout) 
收敛 于 期 望 余弦 信号 的 图 形 ， 将 自 适应 或 收敛 速率 有 改 为 002， 检验 自 适应 过 程 的 速率 是 否 提高 了 。 
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0.5 1 1.5 
l 时 间 (ma) 


图 7.7 自 通 应 滤波 器 输出 收敛 于 期 望 余弦 信和 号 的 图 形 
自 适 应 交互 过 程 
图 7.6 中 ,程序 adaptc.c 的 另 一 个 版 本 是 辅助 材料 中 的 adaptive.e， 它 使 用 Turbo 或 Borland 
CC++ 编 译 ， 具 有 图 形 和 交互 能 力 ， 能 画 出 随 有 的 不 同 自 适 应 变化 的 过 程 。 它 使 用 幅度 为 1 的 期 


望 余弦 信号 和 31 阶 的 滤波 器 。 执 行程 序 ， 输 大 有 为 0.01， 检 验 图 7.8 的 结果 。 注 意 输出 收 伍 于 期 
望 的 余弦 信和 号 。 按 下 F2 键 ， 再 次 运行 程序 ， 输 入 不 同 的 有 值 ， 检 验 输 出 结果 。 


Ei EE DERE 





0 0.001 0.002 0.003 0.004 0.005 
时 间 
一 一 输出 信号 --- 期 望 信和 号 
抽样 频率 = 8000 样 点 数 = 40 
HERPA = 31 BETA = 6.01 


fk Fl 键 打印 输出 ”F2 更 改 BETA 数值 按 Enter 键 退出 


图 78 ”利用 程序 adaptive.c 的 交互 功能 ， 画 出 的 自 
ene Une eer rete 
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$47.2 降 声 抵 销 的 自 适应 滤波 器 

这 个 例子 说 明 使 用 LMS 准则 消除 不 希望 的 正 芯 品 声 的 方法 。 图 7.9 给 出 了 使 用 图 7.1 结构 实 
现 自 适 应 FIR 滤波 器 的 程序 adaptnoise.c。 该 程序 使 用 浮 点 数据 格式 ， 使 用 整数 数据 格式 的 程序 
adaptnoise_ int.c 包含 在 辅助 材料 中 。 

1500 Hz 的 期 望 信号 以 及 秋 加 的 312 Hz 加 性 (不 期 望 ) I SED A ER BE 
个 输入 中 的 一 个 输入 信和 号， 频率 312 Hz 的 参考 ( 模板 ) 余弦 信和 号 作为 有 30 个 系数 的 自 适应 FIR 
滤波 器 输 和 人 .312 Hz 的 参考 信和 号 和 312 Hz 的 加 性 正 蓝 蝶 声 信 号 进行 相关 ,而 不 是 和 期 望 的 1500 Hz 
正弦 信和 号 进行 相关 。 

对 于 每 个 时 刻 n, 计算 自 适应 FIR 滤波 器 的 输出 ,号 30 个 权重 或 系数 随 延 时 抽样 的 输入 一 起 
更 新 , 该 “误差 ”信和 号 E 是 白 适 应 滤波 结构 期 望 的 全 部 输出 ,误差 信号 是 期 望 信 和 号 与 加 性 噪声 信 
号 (dplusn ) 的 差 值 ， 也 是 自 适应 滤波 器 的 输出 y(n) 。 

由 查找 表 产 生 的 所 有 信号 都 是 用 MATLAB 生成 的 , 该 例 中 没有 使 用 外 部 输入 。 图 7.10 给 出 了 计 
算 作为 1500 Hz 期 望 正弦 信号 .312 Hz 加 性 正弦 噪声 信号 以 及 312 Hz 的 余弦 参考 信号 的 MATLAB 程 
FF adaptnoise.m (在 辅助 材料 中 有 一 个 比较 完整 的 版 本 )， 该 程序 计算 了 理想 的 1500 Hz AERES., 
附加 312 Hz HERRA MI 312 Hz 的 余 汞 参考 信和 叶 的 数据 值 ， 生 成 的 文件 (在 辅助 材料 中 ) 分 别 是 : 


1. dplusn: sine(1500 Hz) + sine(312 Hz) 
2. refnoise: cosine(312 Hz) 
图 7.11 给 出 了 表示 1500 Hz 期 望 正弦 信号 的 文件 sin1500.h， 由 文件 sin1500.h 产生 的 信号 频 
率 是 : 
J = F, (8 of cycles)/(# of points) = 8000(24)/128 = 1500 Hz 
常数 beta ETE. 


//A@aptnoise.c Adaptive FIR filter for noise cancellation 


#include <refnoise.h> //cosine 312Hz 

#include «dplusn.h» //Bin(1500) + sini312) 

#define beta 1E-9 //rate of convergence 

#define N 30 //# of weights (coefficients) 
#define NS 128 //& of output sample points 
float wIN]; //buffer weights of adapt filter 
float delay(Ni; /finput buffer to adapt filter 
short output; //overall output 

short out type - 1; //output type for slider 
interrupt void c intl1() //ISR 

{ 

short i; 

static short buffercount-0; //init count of # out samples 
float yn, E; //output filter/"error* signal 
delay[0] = refnoise[buffercount]; //cos(312Hz) input to adapt FIR 
yn = 0; //init output of adapt filter 
for {i = 0; i < N; ie) //to calculate out of adapt FIR 


yn += (wiil * delay[il); //output of adaptive filter 
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E = dpiusn[buffercount] - yn; //*error" signal=(d+n)-yn 
for (i = N-1; i >= 0; i--) //to update weights and delays 
{ . . 
wli} = w[i] + beta*E*delay[i]; //update weights _ 
delay[i] = delay[i-1]; //update delay samples 
J 
buffercount++; //increment buffer count 
if (buffercount >= NS} /fif buffercount=# out samples 
buffercount = 0; //reinit count 
if (out type -- 1) /fif slider in position 1 
output = ({short)E*16); // "error" signal overall output 
. else if (out. type == 2) 


output-dplusn[buffercount]*10; //desired(1500)«noise(312) 


output sample (output); //overall output resu]t 
return; //return from ISR 
} 


void maini} 


{ 


short T=0; 
for (T = 0; T < 30; TH+) 
t 
w[T] - 0; //init buffer for weights 
delayiT] = 0; //init buffer for delay samples 
H 
comm intrí():; //init DSK, codec, McBSP 
while({1}; //infinite loop 


} 





7.9 躁 声 抵 销 的 自 适 应 FIR 滤波 器 程序 ( adapmoise.c ) 
SAdaptncise.m Generates: dplusn.h, refnoise.h, sini500.h 


for i=1:128 
desired{i) = round(l100*sin(2*pi*í(i-1)*1500/8000)); %sin(1500) 
addnoise(i) = round(100*sin(2*pi*(i-1)*312/8000)); $&5in(312) 
refnoise(i) = round(li00*cos(2*pi*(i-1)*312/8000)); %cos(312) 


end 
dplusn = addnoise + desired; &sin(312) + sin{1500} 
fid-fopen('sin1500.h','w'); Sdesired sin(1500) 


fprintf (fid, ‘short sini500[128]-['); 
fprintfí(fid,'&d, ‘ ,desired(1:127)); 
fprintf(fid,'$d' ,desired(128]); 
fprintf(Rd,');3n'); 

fclose (fid); 


& fid=fopen(‘dplusn.h‘,'w'); desired + noise 


* fid-fopen('re£fnoise.h','w'); &reference noise 
eee 


FA 7.10 产生 sine(1500), sine(1500) + sine(312) 和 cosine(312) 数 据 的 MATLAB 程序 ( adaptnoise.m ) 
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short sinl500(128]={0, 92, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38, 


100, 38, -71, -92, 0, $2, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 
100, 38, -71, -92, 0, S2, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 
100, 38, -71, -92, 0, 92, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 
i100, 38, -71, -92, 0, 92, 71, -38, -100, -38, 71, 92, 6, -92, -71, 38 
100, 38, -71, -92, 0, 92, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 
100, 38, -71, -92, 0, 92, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 

D, 92, 71, -38, -100, -38, 71, 92, 0, -92, -71, 38 





图 7.11 生成 128 点 sine(1500 Hz) 数 据 文件 的 MATLAB 头 文件 (sin1500.h ) 


创建 并 运行 工程 adaptnoise, 检验 下 面 的 输出 结果 : 期 望 的 1500 Hz 信号 保留 下 来 而 不 期 望 的 

312 Hz 的 正 苞 信和 号 逐渐 减 小 (被 消除 )、 注 意 在 该 应 用 里 ， 期 望 的 输出 是 误差 依 号 E， 它 自 适应 

(收敛 ) 于 期 望 的 信号 。 当 增 大 beta 时 ， 消 除 不 期 望 信和 号 的 速率 会 更 快 , 但 beta 过 大 ， 就 无 法 观 

察 到 自 适 应 过 程 , 因为 这 时 输出 就 和 1500 Hz 信和 号 一 样 。 将 滑动 条 设置 在 位 置 2 时, 输出 (dplusn ) 
就 是 312 Hz 蛛 声 信和 号 和 期 望 的 1500 Hz 正弦 信号 到 加 的 信号。 


例 7.3 用 自 适 应 FIR 滤波 器 实现 固定 系数 FIR 滤波 器 的 系统 辨识 


图 7.12 给 出 了 对 未 知 系统 建 模 或 识别 未 知 系 统 的 程序 aaaptIDFIR.ec。 也 可 参见 例 72， 它 用 
自 适 应 FIR 滤波 器 消除 噪声 。 

检验 该 自 适 应 方案 , 待 识别 的 末 知 系统 是 一 个 中 心 频率 为 Fy4 =2kHz 的 55 阶 FIR 带 通 滤波 
38. JST EE ARK FIR 滤波 器 系数 包含 在 第 4 章 已 经 介绍 过 的 文件 bp55.cof 中 。 我 们 使 用 一 个 
60 阶 系 数 自 适应 FIR 滤波 器 模拟 这 个 未 知 固定 系数 的 FIR 带 通 滤波 器 。 

在 程序 内 产生 的 伪 随 机 噪声 序列 ( 见 例 2.16 和 例 4.4 )， 并 把 它 分 别 作为 未 知 固定 系数 滤波 器 
和 自 适 应 FIR 滤波 器 的 输 人 ， 输 入 信号 表示 训练 信号 。 自 适应 过 程 -一直 继续 下 去 ， 直 到 误差 信和 号 
达到 最 小 。 反 馈 的 误差 信号 就 是 未 知 固定 系数 FIR 滤波 器 和 自 适 应 FIR 滤波 器 输出 的 差 值 。 

在 每 个 延迟 抽样 缓冲 区 ( 固定 系数 和 自 适应 FIR) 中 ， 有 一 个 额外 的 存储 单元 ， 它 用 于 更 新 
延 时 抽样 (参见 例 4.8 中 的 了 773 )。 

建立 并 运行 工程 adaptIDFIR ( 使 用 C67x 浮 点 工具 ), 检验 自 适应 滤波 器 的 输出 ( adaptfir_out ) 
是 一 个 中 心 频率 为 2 kHz 的 带 通 滤波 器 ( 在 请 动 条 选项 在 默认 位 置 1), 当 滑 动 条 设置 在 位 置 2 时 ， 
检验 由 系数 文件 bp55.cof 表示 的 、 中 心 频 率 为 2 KHz 的 固定 系数 FIR 带 通 滤波 器 的 输出 (fir_out ), 
这 时 能 观察 到 它 的 输出 实际 上 与 自 适应 滤波 器 的 输出 一 样 。 

编辑 主 函 数 ， 添 加 系数 文件 BS55.cof ( 在 例 44 中 介绍 过 )， 它 表示 一 个 中 心 频率 为 2 kHz、 
55 阶 系数 的 FIR 带 阻 滤波 器 ， 将 该 带 阻 滤波 器 作为 待 识别 的 未 知 系统 。 

重新 建立 和 运行 工程 ， 检 验 自 适 应 FIR 滤波 器 ( 滑动 条 设置 在 位 置 1 ) 输出 是 否 和 FR ODER 
滤波 器 〈 滑动 条 设置 在 位 置 2 ) 实际 上 是 一 致 的 。 将 beta 以 10 为 倍数 增 大 (或 减 小 )， 观 察 收 伍 
BEMA ORR) 的 情况 。 将 权重 ( 系数 ) 的 个 数 由 60 减 小 到 40， 检 验 识别 过 程 是 否 稍微 有 点 
变 差 。 


例 7.4 将 权重 初始 化 为 FIR 带 通 滤波 器 ， 用 自 适应 滤波 器 实现 固定 系数 FIR 系统 的 识别 
将 例 7.3 程序 adaptIDFIR.c 稍 做 改动 ， 建 立 程序 adaptIDFIRW.c ( 在 辅助 材料 中 )， 新 程序 用 
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中 心 频率 为 3 kHz 的 FIR 带 通 滤波 器 系数 文件 bp3000.cof ( 在 辅助 材料 中 ) 初始 化 自 适 应 FIR W 
波 器 的 权 值 。 在 main 函数 里 ， 权 值 wii 不 用 0 初始化， 而 用 文件 bp3000.cof 中 的 系数 初始 化 。 


/MaptIDFIR.G Adaptive FIR for system ID of an FIR (uses C67 tools) 


#include 
#include 


"bp55.cof" 
"noise gen.h" 


#define beta 1E-13 

#define WLENGTH 60 

float w[WLENGTH-*i]; 

int dly adapt[WLENGTH41];: 
int dly fix[N*1]; 


short out type - 


1: 


int fb; 
shift, reg sreg; 


int prandivoid) 


{ 


} 


i 


nt prnseq; 


if (sreg.bt. bo} 


prnseq = -8000; 


else 


prnseg = 8000; 


fb -(sreg.bt.b0)^(sBreg.bt.b1); 
fb^-(sreg.bt.bll)^(sreg.bt.b513); 
sreg.xegval««z1; 

sreg.bt.b0=fb; 

return prnseq; 


interrupt void c, intl1l) 


{ 


int i; 

int fir_out = 0; 

int adaptfir_out = 0; 
float E; 

dly fix[0] = prand(); 


dly, adapt [0] 2dly fix[0]; 


for {i = 


{ 


} 


for {i = 


N-1; i»- 0; i--) 
fir out 4-(h[i]*dly fx[il); 


dly ARx[i*1] = dly fx[il; 


0; i « WLENGTH; i++) 
adaptfhr out --(w[i]*dly adapt[i]); 


jinxed FIR filter coefficients 
//support noise generation file 
//rate of convergence 

//*# of coefffor adaptive FIR 
/fbuffer coeff for adaptive FIR 
//buffer samples of adaptive FIR 
//buffer samples of fixed FIR 
//output for adaptive/fxed FIR 
//feedback variable 

//shift register 


/fpseudo-random sequence (-2,1) 


/ísScaled negative noise level 


//scaled positive noise level 
//XOR bits 0,1 
//with bits 11,13 -> £b 
//close feedback path 
//return noise sequence 


//ISR 


/finit output of fixed FIR 
//init output of adapt FIR 
//errorsdiff of fixed/adapt out 


//input noise to fixed FIR 
/fa8 well as to adaptive FIR 


/ffixed FIR filter output 
//update samples of fixed FIR 


/fadaptive FIR filter output 
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E = fir out - adaptfir out; //error signal 


for (i = WLENGTH-1; i >= 0; i--) 
n 
w[i] = wfi]+(beta*E*dly_ adaptli]); //update weights of adaptive FIR 


dly_adapt[i+i] = dly adaptlil:; //update samples of adaptive FIR 
} oa 
if (out type == 1) //Slider position for adapt FIR 
output sample(adaptfir out); //output of adaptive FIR filter 
else if (out type == 2) //slider position for fixed FIR 
output, sample (fir out); //output of fixed FIR filter 
return; 


} 


void main() 


w[i] = 0.9; //init coeff for adaptive FIR 
dly adapt[i] = 0; /finit buffer for adaptive FIR 
} 
for iT = 0; T < N; T+} 


dly_fix[T] = 0; //init buffer for fixed FIR 
sSreg.regval-ÜxFFFF; /finitial seed value. 
fb = 1; //initial feevack value 
comm intrí); /finit DSK, codec, McBSP 
while (1); /finfinite loop | 


} 





图 7.12 用 自 适应 滤波 器 模拟 (识别 ) 固定 系数 FIR 滤波 器 的 程序 ( adaptIDFIR.c ) 


建立 工程 adaptIDFIRw ( 使 用 C67x 浮 点 工具 )。 最 初 ， 自 适应 FR 滤波 器 输出 频谱 是 中 心 
频率 为 3 kHz 的 FIR 带 通 滤波 器 ， 然 后 ， 当 参考 滤波 器 逐渐 停止 输出 时 ， 输 出 频谱 逐渐 调整 “ 收 
S) 于 中 心 频率 为 2 kHz 固定 系数 (AA) 的 FIR 带 通 滤波 器 ( 用 bp55.cof 表示 )。 当 自 适应 发 
生 时 ， 在 有 些 时 间 可 以 观察 到 两 个 带 通 滤波 器 ， 为 了 便于 观察 ， 通 常 希望 慢 慌 地 增加 自 适 应 的 速 
率 (beta 值 )。 ` 

图 743 显示 了 用 CCS 图 进行 自 适应 的 过 程 ， 图 7.14 显示 了 用 HP 动态 信和 号 分 析 仪 进行 实时 
自 适 应 的 过 程 。 


$175 自 适 应 FIR 用 于 固定 系数 OR 系统 的 识别 

图 7.15 给 出 了 程序 adaptIDIIR.e, 它 使 用 自 适 应 FIR 滤波 器 模拟 或 识别 ( 固定 系数 的 未 知 OR ) 
系统 。 参 见 实现 TIR 滤波 器 的 例 5.1 以 及 实现 自 适 应 FIR 滤波 器 的 鲍 7.3 和 例 7.4， 后 两 个 例子 实 
. AREA FR ERE. 

AT WESS ERR, HEPES AOE, Aa LEY 2 kHz 的 36 
Br IR 滤波 器 ， 有 18 个 二 阶 单元 ， 滤 波 器 系数 包含 在 例 5.1 介绍 的 文件 bp2000.cof H. H 200 
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个 系数 的 自 适应 FIR 滤波 器 来 构建 固定 系数 未 知 的 TIR 带 通 滤波 器 ， 但 为 了 建 一 个 更 好 的 模型 ， 
需要 比 该 自 适应 滤波 器 更 多 的 系数 或 权 值 





(c) 当 使 用 简化 的 3 Hz 滤波 器 时 ， 权 重 收敛 于 2 kHz 的 滤波 器 (d) ACT 2 kHz 的 带 通 滤波 器 ， 自 适应 过 程 结束 
图 7.13 CCS 画 出 的 显示 自 适 应 滤波 器 自 适应 过 程 的 图 形 


生成 一 个 伪 随 机 噪声 序列 ( 见 例 2.16 ), 把 它 作为 固定 系数 IIR 滤波 器 和 自 适应 FIR 滤波 器 的 
输入 。 自 适应 过 程 一 直 继续 下 去 直到 误差 信号 最 小 ， 反 馈 的 误差 信号 是 未 知 固定 系数 的 IIR 滤波 
器 和 自 适应 FIR 滤波 器 输出 的 差 值 

建立 并 运行 工程 adaptIDIIR ( 使 用 C67x 浮 点 工具 )， 检 验 输出 (adaptfir_out ) 收敛 于 (模拟 ) 
中 心 频率 为 2 kHz 的 IIR 带 通 滤波 器 ( 滑动 条 选项 最 初 在 位 置 1 )。 当 滑动 条 设置 在 位 置 2 时, 检 
验 输出 (iir_out ) 为 固定 系数 的 TIR 带 通 滤波 器 

添加 系数 文件 lp2000.cof， 替 代 文件 bp2000.cof， 文 件 1p2000.cof 表示 一 个 截止 频率 为 2 kHz 
的 8 Br IIR 低 通 滤波 器 ， 关 于 该 滤波 器 已 在 例 5.1 中 介绍 过 。 检 验 自 适应 FIR 滤波 器 现在 已 调整 
为 截止 频率 为 2 kHz 的 OR 低 通 滤波 器 
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RANGE: -1 dEV STATUS: PAUSED 
LL -RRStios 
































“3 
des 
i dos IMEEM 
dE 1 
Div | 
本 | 
i 
mae rea risas c puras i 
ea | 
"P! 
i 
a i 
H g 
-a2 i | : : A o: Do. 
TART! B Hz Bü 4.742 Hz STOP: N de Hz 
! 2868 Hz Y:-33.54 div 
(a) 显示 中 心 频率 为 3 kHz Al 2 kHz 的 滤波 器 
RANGES ^1 dV STATUS: PAUSED 
[Hui RMS: 100 
-3 : - 
aBy 
18 i OOA SE OOA, OE 
aE 
“LIV 
-82 : | : : 
STAPT: 0 Hr Mi 42.742 Hz STOP: S O08 Hz 
X: 2680 Hz Y:-289.&8 dE t 
(b) ARAT poc MESES 3 kHz 的 滤波 器 
RANGE: -1 dBY STATUS? PAUSED 
PT RNS1 inp 
-3 ` . 4 
aby 
19 
d 
-Div 
START: € À - 四 STOP? S BOS Hz 
: +7 x : 
4: S800 Mz v1-28, SE" dBY 


(©) 收 伍 于 中 心 频率 为 XH 网 定 系数 的 洲 波 器 
图 7.14 用 HP 动态 信号 分 析 仪 获得 的 收 伍 于 2 kHz 的 自 适应 过 程 


+ diy fi[il[1] 





180 DSP 原理 及 其 C 编程 开发 技术 





//M|MAptIDIIR.c Adaptive FIR for system ID of fixed IIR using C67x tools 


#include *bp2000.cof* //BP @ 2kHz fixed IIR coeff 
#include "noise gen.h" //support file noise sequence 
Kdeftne beta 1E-11 //rate of convergence 

#define WLENGTH 200 //* of coeff for adaptive FIR 
float w[WLENGTH*1]; /fpuffer coeff for adaptive FIR 
int dly adapt [WLENGTH+1]; //buffer samples of adaptive FIR 
int dly Rx[stages][2] = {0}; //delay samples of fixed IIR 

int a[stages][3], b[stages] [2]; //coefficients of fixed IIR 

short out type = 1; //8lider adaptive FIR/fixed IIR 
int fb; //feedback variable for noise 
shift reg sreg; //shift register for noise 

int prand(void) //pseudo-random sequence (-1,1) 


{ 
int prnseq; 
i£f(sreg.bt.b0) 


prnseq - -4000; //scaled negative noise level 
else 
prnseq= 4000; //sealed positive noise level 
fb -(sreg.bt.b0)^(sreg.bt.b1); //XOR bits 0,1 
fb*={sreg.bt.b11}*(sreg.bt.b13); //with bits 11,13 ->fb 
sreg.regval<<=1; 
sreg.bt.b0=fb; //close feedback path 
return prnseq;: / {return noise sequence 
) 
interrupt void c_int11{} //ISR 


{ 
int i, un, input, yn: 


int iir out-0; . //init output of fied IIR 

int adaptfir_out=0; ` J//init output of adaptive FIR 
float E; //error signal 

dly fix[0][0] = prandii); //input noise to fixed IIR 

dly adapt[O] = dly fx[0][0]; //same input to adaptive FIR 
input = prand(); ` //noise as input to fixed IIR 
for (i = D; i < stages; i++) //repeat for each stage 


{ 
unzinput- ((b[i] [0] *dly_fix[i] {0])>>15}~((b{i] [1] *dly_fix[i] [1]}>>15); 


yn={ {afi} [0] *unj)>>15)}+4( (afi) {1]*dly_fix[i] 16])>>15) 
*ilalil[r2]*aàly fix[ilf11)»215); 


il 


dly_fix[i] [0]: //update delays of fixed IIR 
dly fix[il[O] un; //update delays of fixed IIR 
input = yn; //in next stage-out previous 
) 
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iir out = yn; 


for (i = 0; i « WLENGTH; i++} 


adapthr out -«-(w[i]*dly adapt[i]): 


E = iir, out - adaptfir out; 


//output of fixed IIR - 


//output of adaptive FIR 


//error as difference of outputs 





for (i = WLENGTH; i > 0; i--) 
, 


w[i] = w(il*i(beta*E*dly adapt[i]):; //update weights of adaptive FIR 
ly adapt[i] = dly adapt[i-1]; //update samples of adaptive FIR 
J 

if (out type -- 1) //slider adaptive FIR/fixed IIR 
output sample(adaptfir out); //output of adaptive FIR 

else if (out type == 2) 
output sample(iir out); //output of fixed IIR 

return; //return to main 

} 

void main() 

{ 

int i=0; 

for (i = 0; i < WLENGTH; i++) 


{ 

w[i] = 0.0; 

dly adapt[i] = 0.0; 
} 


//init coeff of adaptive FIR 
/finit samples of adaptive FIR 


sreg.regval=OxFFFF; 
fb = 1; 

comm intrí(); 

while (1); 


//initial seed value 
/finitial feedback value 
//init DSK, codec, McBSP 
//infinite loop 


} 


CQ 
7.15 自 适应 FIR 模拟 (识别) 固定 系数 TIR. 滤波 器 的 程序 (adaptIDIIR.c ) 


H76 自 适 应 预测 器 用 于 消除 宽带 信号 上 秋 加 的 窄带 干 护 

图 7.16 给 出 了 实现 自 适应 FIR. 预测 器 程序 adaptpredict.c, ERR HES PHS TH. E 
加 率 带 干 拢 的 宽带 信和 号 被 延迟 ， 并 作为 60 个 系数 的 自 适应 FIR 滤波 器 的 输入 。 

期 望 的 宽带 信号 由 图 7.17 所 示 的 MATLAB 程序 whbsignalm 产生 ， 它 生成 一 个 256 点 的 查找 
表 并 包含 在 文件 wbsignalh P (TEREE) 生成 的 随机 序列 {-1,1] 被 定 标 处 理 后 ， 写 人 到 文 
件 wbsignalh 中 。 随 机 序列 长 为 128 位 ， 位 速率 为 4 kHz, 将 它 上 抽样 为 位 速率 为 8 kHz 的 256 
点 序列 ， 生 成 的 宽带 随机 序列 《 用 文件 wbsignalh ) 表示 所 要 的 信和 号。 

窜 带 于 扰 是 外 部 信号， 和 产生 的 随机 序列 带宽 相 比 ( 所 期 望 的 宽带 信号 )， 干扰 信和 导 的 带宽 
相对 来 说 较 窄 ， 因 此 干扰 信号 的 样 点 是 高 度 相关 的 ， 另 一 方面 ， 宽带 信号 的 样 点 之 间 相对 来 说 是 
互 不 相关 的 。 
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/fAGaptpredict.C Adaptive predictor to cancel interference 


#include "wbsignal.h* //wide-band signal table look-up 
#define beta 1E-14 //rate of convergence 

#define N 60 //* of coefficients of adapt FIR 
const short bufferlength = NS; //buffer length for wideband signal 
short splusn[N*1i; /fbuffer wideband signal-interference 
float w[N+1]; //buffer for weights of adapt FIR 
float delay[N+1]; /fbuffer for input to adapt FIR 
interrupt void c_intii{} //ISR 

i 

Static short buffercount-0; ffinit buffer 

int i; 

float yn, E; //yn-out adapt FIR, error signal 
short wb, signal; //wideband desired signal 

short noise; //external interference 


wb signal-wbsignal[buffercount]; //wideband signal from look-up table 


noise = input_sample(}; //external input as interference 
splusn(0] = wb signal + noise; //wideband signal+interference 
delay[O0] = splusn[3]:; //delayed input to adaptive FIR 
yh = Q; f/finit output of adaptive FIR 
for (i = 0; i < N; i++) 

yn += {w[i} > delay[il); //output of adaptive FIR filter 
E = splusn[O0] - yn; //(wideband*noise)-out adapt FIR 


for (i = N-1; i >= 0; i--) 
1 
wii] = wiil-(beta*E*delay[il): //update weights of adapt FIR 


deiay[i*i] = delayíil: //update buffer delay samples 
splusn[i*1] s splusn[i]; //update buffer corrupted wideband 
1 

buffercount++; //incr buffer count of wideband 

if (buffercount >= bufferlength) //if buffer caunt-length of buffer 
buffercount = 0; //reinit count 

output sample(ishort)E); //overall output 

return; 


} 


void main(} 


{ 
int T = 0: 
for (T = 0; T < N; T++} //init variables 
( 
w[(T] = 0.0; //buffer for weights of adaptive FIR 
delay[T] = 0.0; //buffer for delay samples 
Splusn[T] = 0; //buffer for widebandrinterference 
} 
comm intrí); //init DSK, codec, McBSP 
while(1]; //infinite loop 


) 





E746 THERES PE THE S) Se EEE (adaptpredict.c ) 











第 7 章 . 自 适 应 滤波 器 183 











&wbsignal.m Generates wideband random sequence. Represents one-info bit 


len_code = 128; Slength of random sequence 

code = 2*roundirand(1,len_code)}-1;  *$generates random sequence {1,-1} 

sample_rate = 2; ‘up-sampling from à to &kHz 

NS = len code * sample rate; S&length of up-sampled sequence 

sig = zeros{1,NS); ‘initialize random sequence 

for i = 1:len code ‘obtain up-sampled random sequence 
sig((i-1)*sample rate + 1:i*sample_rate) = code(i); | 

end; f 

wbsignal = sig*5000; *&scale for p-p amplitude of 500mv 

fid-fopen('wbsignal.h','w'); &open fille for wideband signal 


fprintf(fid,'4define NS 256 //number of output sample pointe\n\n’); 
fprintf(fid,'short wbsignal[256]-('):; 

fprintfí(fid,'$d, ' ,wbsignalí1:NS-1)); à 

fprintf(fid,.'$d' ,wbsignal(NS)]; 

fprintf (fid, ');Xnin'); 

fclose (fid) ; 

return; 





717 产生 宽带 随机 序列 的 MATLAB 程序 ( wosingnal.m ) 


由 于 罕 带 干扰 信号 的 特点 ， 因 此 算 序 中 根据 过 去 的 抽样 splusa 估计 府 带 干扰 信号 是 可 能 的 。 
谷 加 窑 带 干扰 的 宽带 信号 splusn 先 被 延迟 ， 然 后 输 和 到 自 适 应 FIR REA, ERRARE 
长 ,使 宽带 信和 号 和 未 延迟 的 抽样 不 相关 。 

自 适应 FIR 滤波 器 的 输出 是 相关 牵 带 干扰 的 估计 . 因此 , 误差 信 生 五 是 期 望 的 宽带 信号 的 估计 。 

建立 并 运行 工程 adaptpredict( FH C67x 浮 点 工具 ), MARRIT IEK 1 kHz 到 3 kHz 的 正弦 
输入 信和 导 ， 运 行程 序 并 检验 输 人 干扰 信 叶 逐 汤 减 小 ， 误 盖 信 号 巨 的 输出 谱 妆 倒 于 期 望 的 宽带 信 生 。 

改变 输 人 正 莹 干扰 信号 的 频率 ,观察 消除 外 部 干扰 的 Aisne, 将 beta 增加 到 10, 可 以 观 
FEE SOR BE ULT s 

期 望 的 宽带 信号 可 以 通过 输出 信号 wb. signal 来 观察 , 另外 , 通过 output sample ( splusnio] ), 
可 以 观察 登 加 干扰 的 宽带 信号 。 当 外 部 于 扰 信 号 幅度 大 约 是 宽带 信 号 幅度 的 3 倍 时 ， 能 得 到 更 好 
的 结果 。 
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第 8 章 程序 优化 方法 


本 章 内 容 主 要 包括 : (1) 提高 程序 效率 的 优化 方法 ;( 2) 内 部 C 函数 ; (3) 并 行 指令 ; (4) 
字 长 数据 的 访问 ; (5) 软件 流水 线 方法 。 

本 章 将 讲述 几 种 程序 优化 方法 ， 这些 方法 将 极 大 地 降低 程序 执行 时 间 ， 包 括 并 行 执行 指令 的 
使 用 ， 按 字 访 问 数据 、 内 部 函数 和 软件 流水 线 方法 等 。 


8.1 引言 


我 们 从 工作 站 级 开始 , 例如 在 PC 上 使 用 C 程序 。 汇编 语言 程序 只 适合 于 特定 的 处 理 器 硬件 ， 
B. C 语言 程序 却 可 以 很 容易 地 从 一 个 平台 移 覃 到 另 一 个 平台 ; 另 一 方面 ,经 过 优化 的 汇编 语言 各 
序 要 比 C 语言 程序 执行 速度 快 ， 且 占用 的 内 存 更 少 。 

程序 优化 之 前 ， 首 先 要 确保 程序 可 以 实现 相应 的 功能 并 能 得 到 正确 的 结果 。 因 为 程序 经 优化 
后 ,程序 代码 的 顺序 可 能 要 被 重新 组 织 和 排序 ， 这 样 ， 优 化 过 程 会 使 程序 变 得 很 难 阅读 和 理解 。 
在 程序 优化 时 ， 必 须 意识 到 : 如 果 C 程序 算法 的 功能 是 正确 的 且 运 算 速度 令 人 满意 ， 就 没有 必要 
再 对 程序 进行 优化 。 

在 测试 完 C 程序 的 功能 后 , 把 它 传输 到 C6x 平台 上 。 先 用 浮 点 方式 进行 模拟 仿真 ， 如 果 需 要 
的 话 ， 再 把 它 转 换 成 定点 实现 方式 。 如 果 程 序 的 性 能 不 够 好 的 话 ， 再 利用 不 同 的 编译 选项 实现 软 
件 流水 线 (后 面 将 讨论 )， 减 少 完 余 循环 等 。 如 果 程 序 的 性 能 仍 达 不 到 要 求 ， 可 以 不 使 用 循环 语 
句 ,避免 分 支 语句 中 的 开销 所 占用 时 间 ， 这 种 措施 通常 可 以 提高 运算 速度 , 但 会 增加 程序 的 长 度 。 
为 了 提高 运行 速度 ， 也 可 使 用 按 字 进 行 存 取 的 优化 方法 ， 即 存 取 32 位 (int 整 型 数据 ) 的 字 而 不 
是 16 fit (short 短 整 型 数据 ) 的 半 字 ， 然 后 再 分 别 对 高 低 16 位 数据 进行 处 理 。 

如 果 性 能 仍 不 能 令 人 满意 ， 可 以 用 线性 汇编 重新 编写 对 时 间 要 求 较 严 的 程序 部 分 ， 进 而 用 江 
编 优化 程序 进行 优化 ， 也 可 以 使 用 函数 前 析 器 确定 需要 进一步 优化 的 特定 函数 。 

最 后 一 个 讨论 的 优化 过 程 是 软件 流水 线 方法 ， 通 过 该 技术 得 到 手工 编制 的 汇编 指令 "2。 为 了 
获得 高 效 最 优 的 程序 ， 笨 循 软件 流水 线 相关 的 步骤 是 非常 重要 的 。 


8.2 ”优化 步骤 


如 果 经 过 任何 特定 的 步 又 ,程序 的 福 能 和 结果 是 令 人 满意 的 ， 那么 优化 过 程 也 就 结束 了 。 一 
般 来 说 ， 需 要 经 过 以 下 几 步 ， 


L 编写 C 语言 程序 ， 创 建 未 经 优化 的 相关 工程 。 

2. 在 不 同 优化 层次 上 进行 优化 。 如 果 合 适 的 话 ， 使 用 内 部 函数 。 

3， 使 用 剖析 器 确定 需要 进一步 优化 的 函数 ， 然 后 将 它们 修改 成 线性 汇编 函数 。 
4. 对 汇编 程序 进行 优化 。 
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8.2.1 


编译 器 选项 


当 优 化 程序 启动 后 ， 它 将 按 下 面 的 步骤 执行 ，C 程序 首先 通过 语法 解析 程序 ， 执 行 预 处 理 功 
能 ， 并 产生 一 个 中 间 文 件 《 让) 输入 给 优化 程序 ， 此 后 优化 程序 就 会 生成 一 个 .opt 文件 ， 并 将 它 
输入 给 程序 代码 产生 器 进行 进一步 优化 ， 最 后 生成 汇编 语言 文件 。 

编译 器 选项 的 不 同 ， 表 示 启 用 不 同 的 优化 方法 。 编 译 选项 包括 ， 


E wh = 


. o0 优化 寄存 器 的 使 用 。 

，-ol 除 执行 前 一 选项 -o0 的 优化 功能 外 ， 还 进行 局 部 优化 。 

，-02 除 执行 前 面 两 个 选项 -o0 和 -ol 的 优化 功能 外 ， 还 进行 全 局 优化 。 

. —o8 除 执行 前 面 三 个 选项 -00，-ol 和 -02 优化 功能 外 ， 还 对 整个 文件 进行 优化 。 


选项 -o2，-03 还 试图 进行 软件 优化 。 


8.2.2 


内 部 C 函数 


有 许多 现成 的 C 语言 内 部 画 数 可 供 调 用 ， 这 些 函 数 可 提高 程序 的 效率 ( 参见 例 3.1 ); 


1. 


2. 


us 


+ 


UA 


8.3 


Ww e wW 一 


8.4 


int_mpy( ) 与 汇编 指令 中 的 MPY 相同 ， 将 一 个 数 的 16 位 最 低 有 效 位 乘 以 另 一 个 数 的 16 
位 最 低 有 效 位 。 

int, mpyh( ) 与 汇编 指令 中 的 MPYH 相同 , 将 一 个 数 的 16 位 最 高 有 效 位 乘 以 另 一 个 数 的 16 
位 最 高 有 效 位 。 


. int mpylh( ) 与 汇编 指令 中 的 MPYLH 相同 ， 将 一 个 数 的 16 位 最 低 有 效 位 滋 以 另 一 个 数 的 


16 位 最 高 有 效 位 。 


，int_ mpyhl( ) 与 汇编 指令 中 的 MPYHL 相同 ， 将 一 个 数 的 16 位 最 高 有 效 位 匀 以 另 一 个 数 的 


16 位 最 低 有 效 位 。 


.Yoid_nassertfint) 不 产生 程序 代码 ， 它 通知 编译 器 用 表达 式 说 明 药 声明 函数 为 真 ， 并 把 相关 


信息 通知 给 编译 器 。 这 些 信息 包括 : 指针 、 数 据 的 排列 方式 以 及 有 效 的 优化 方案 ， my 
长 优化 的 排列 方式 。 


. uint lo(double)5 vint hi(double) 2 SIS DUM EF BS 32 位 与 低 32 位 (只 在 C67x 或 


C64x 才 有 )。 
代码 的 优化 过 程 


:使 用 并 行 指令 以 便 在 同一 个 时 钟 周 期 操作 多 个 功能 单元 。 
删除 空 操作 指令 (NOP) 或 延迟 时 际 ， 在 NOP 处 放置 程序 代码 。 
， 解 开 循 环 语句 ， 避 免 分 支 语句 的 开销 。 

.使 用 按 字 访问 32 位 字 (int )， 而 不 是 16 位 半 字 (short). 

.使 用 软件 流水 线 ， 在 8.5 节 将 对 此 进行 介绍 。 


使 用 代码 优化 方法 的 程序 举例 


下 面 将 举例 说 明 不 同 的 优化 方法 是 如 何 提高 代码 效率 的 〔 利 用 软件 流水 线 进行 优化 将 在 8.5 节 
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Wit), 仍然 使 用 点 积 作为 例子 说 明 不 同 优化 方案 的 作用 。 两 个 数组 的 点 积 运 算 对 于 许多 DSP 算 
法 来 说 是 非常 有 益 的 ， 如 滤波 与 相关 运算 。 假 定 在 下 面 的 例子 中 ,每 个 数组 包含 200 个 数 。 第 3 章 
给 出 了 一 些 使 用 C 和 汇编 的 混合 编程 的 例子 ， 提 供 了 一 些 必要 的 背景 。 


例 8.1 按 字 访问 数据 ， 定 点 实现 兼 积 之 和 的 C 程序 


图 8.1 为 C 程序 twosum.c， 它 可 按 32 位 字 格 式 访问 数据 ,实现 两 个 数组 的 乘积 之 和 。 例 中 
每 个 效 组 含有 200 个 数 。 EMERARA ERROA RRA ARAA, 在 循环 外 计算 奇数 项 
与 偶数 项 的 总 和 。 

由 于 是 泽 点 型 ， Hag 中 的 函数 及 变量 sum, suml 和 sumh 定义 为 float， 而 不 是 int: 

float dotp (float a[ ], float b [ 1} 
i 


float suml, sumh, sum; 
int i: 


j 


SSE 
f/twosum.c Sum of Products with separate accumulation of even/odd terms 
//with word-wide data for fixed-point implementation 


int dotp (short a[ ], short b [ ]) 
í . 
int suml, sumb, sum, i; 


sumi = 0 
sumh = 0 
sum = 0 


for {i = 0; i « 200; i +=2) 


sunl += a[i] * bii]; //3um of products of even terms 


sumh += ali + 1] * bli + 1]; //8um of products of odd terms 
} 
sum = suml + sumh; //final sum of odd and even terms 


return {aum}; 





图 8.1 PARE, RAR ROL aR A, SCORERS ANY CEF ( twosum.c ) 


82 利用 C 内 部 函数 实现 乘积 不 同 部 分 的 和 

-图 8.2 为 C 程序 dotpintrinsic.c， 它 说 明了 利用 C ARAR mpy 与 _mpyh 来 计算 各 自 乘积 的 
和 ,这 两 个 函数 在 汇编 语言 函数 中 对 应 等 价 于 MPY 和 MPYH、 尽 管 如 此 ， 奇 数 项 与 偶数 项 乘积 
之 和 仍 在 循环 内 计算 的 ， 最 后 总 和 的 计算 被 放 在 循环 之 外 ， 作 为 函数 的 返回 值 。 
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//4otpintringic.c Sum of products with C intrinsic functions using C 
for {i = 0; i « 100; i++} 


suml = suml +  mpy(a[i], bIil]bh: 
sumh = sumh + mpyhíalil, b[il):; 
} 
return (suml + sumh); 


图 8.2 利用 C 内 部 函数 计算 各 自 飞 积 的 和 ( dotpinmnsic.c ) 


$08. ”利用 线性 汇编 程序 及 按 字 访 问 数 据 ， 定 点 实现 乘积 的 和 

图 8.3 为 线性 汇编 程序 twosumlasmfix.sa, 它 利用 线性 汇编 定点 实现 莱 积 的 两 个 不 同 部 分 的 和 。 
程序 中 没有 必要 指定 功能 单元 和 NOP 指令 ， 另外， 符号 名 可 用 来 表示 寄存 器 。LDW 指令 可 用 来 ， 
传送 一 个 32 位 字 长 的 数据 (使 用 LDW Rf, 数据 在 存储 器 中 一 定 要 按 字 对 齐 排列 ;, 低 16 位 和 高 
16 位 乘积 单独 计算 ， 两 个 ADD 指令 分 别 累加 和 次 数 项 与 偶数 项 积 的 和 。 


;tworunlagmfiz.ga Sum of Products. Separate accum of even/odd terms 
:With word-wide data for fixed-point implementation using linear ASM 


loop: LDW *aptr++, ai 32-bit word ai 
: LDW *bptr++, bi 732-bit word bi 
MPY ai, bi, prodi ¡lower 16-bit product 
MPYH ai, bi, prodh rhigher 16-bit product 
ADD prodl, suml, suml jaccum even terms 
ADD prodh, sumh, sumh ;accum odd terms 
SUB count, 1, count ¡decrement count 
[count] 5 Loop ;branch to loop 


图 8.3 ”利用 线性 汇编 ， 定 点 实现 乘积 不 同 部 分 的 和 ( twosumlasmfix.sa ) 


f/84 利用 线性 汇编 及 双 精 度数 传送 指令 ， 浮 点 方式 实现 生 积 的 和 

图 8.4 为 线性 汇编 程序 twosumlasmfloat.sa， 它 利用 线性 汇编 及 双 精 度数 传送 指令 ， 浮 点 
实现 乘积 的 和 。 双 精度 数 传送 指令 LDDW 将 一 个 64 位 的 数据 传送 到 一 寄存 器 对 中 。 每 个 单 
精度 乘积 指令 MPYSP 执行 一 个 32 x 32 的 乘法 , 低 32 位 与 高 32 位 的 乘积 之 和 得 到 32 位 奇偶 
项 的 总 和 。 l 


stwosumlasmicat.ga Sum of products. Separate accum of even/odd terms 
¿Using double-word load LDDW for floating-point implementation 





loop: LDDW *aptr-*, ail:aid :64-bit word aid and aii 
LDDW *bptr++, bil:bio 764-bit word bid and bil 
MPYSP ai0, bid, prodl ;lower 32-bit product 
MPYSP Bii, bil, prodh thiagher 32-bit product 
ADDSP ' prodl, suml, sumi :&ccum 32-bit even terms 
ADDSP prodh, sumh, sumh ;accum 32-bit odd terms 
SUB count, 1, count ;decrement count 
[count] ` E loop branch ta loop 


8.4 利用 线性 汇编 及 LDDW 指令 ， 浮 点 实现 乘积 不 同 部 分 的 和 《twosumlasmiloat sa ) 
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例 8.5 使 用 汇编 及 无 并 行 指令 ， 定 点 实现 点 积 
图 8.5 为 汇编 程序 dotpup.asm， 该 程序 没有 使 用 并 行 指令 ， 并 采用 定点 方式 实现 点 积 。 所 有 
的 Cox 器 件 都 可 执行 定点 指令 ， 但 浮 点 实现 需要 像 C6711 DSK 这 样 的 C67x 平台 


rdotpnp.agm ASM Code with no-parallel instructions for fixed-point 


MVE 51 200, Al ¿count into Al 
ZERO -L1 AT ¿init A7 for accum 

LOOP LDH .Di *Ad++,A2 ;AÀ2-216-bit data pointed by A4 
LDH -D1 *AG++,A3 7A9=16-bit data pointed by AB 
NOP 4 74 delay slots for LDH 
MPY .M1 A2,A31,A6 ¿product in A& 
NOP ;1 delay slot for MPY 
ADD Li AS,AT,A7 accum in A7 
SUB Sl Al,1,A1 ;decrement count 

[A1] B .82 LOOP tbranch to LOOP 

NOP 5 75 delay slots for B 


图 8.5 无 并 行 指令 ,定点 实现 点 积 的 汇编 程序 dotpnp.asm ) 


一 个 铂 坏 可 以 选 代 200 次 。 对 于 定点 实现 , 每 个 指针 寄存 器 A4 Al AS 加 1， 指 向 缓冲 区 的 下 
TEF (16 位 )， 但 是 对 于 浮 点 实现 ， 一 个 指针 寄存 器 加 1， 指 向 的 是 下 一 个 32 位 的 字 。 数 据 
传送 、 相 乘 和 分 支 指令 必须 分 别 使 用 功能 单元 .D，.M ALS; 加 法 与 减法 指令 可 以 使 用 任何 单元 

( 除 .M 外 ) 在 循环 内 的 指令 每 次 迁 代 需要 16 个 时 钟 周期 ， 这 样 就 需要 16 x 200 = 3200 个 时 钟 
周期 。 表 8.4 ( 见 本 章 结尾 ) 给 出 了 定点 和 浮 点 实现 的 几 种 优化 方案 的 比较 情况 。 


例 8.6 使 用 汇编 和 并 行 指令 ， 定 点 实现 点 积 

图 8.6 是 汇编 程序 dotpp.asm， 它 使 用 并 行 指令 ， AGRAR, 它 使 用 程序 代码 替代 NOP 
指令 ， 从 而 减少 NOP 指令 的 数量 。 “ 

由 于 两 个 操作 数 来 自 不 同 的 寄存 器 组 或 不 同 的 路 径 ，MPY 指令 使 用 一 个 交叉 路 径 { .MIx )。 
SUB 和 B 指令 被 移 到 程序 前 面 ， 填 补 LDH 指令 需要 的 延迟 时 隙 ;分 支 指令 在 ADD 指令 之 后 执 
ffe 由 于 使 用 并 行 指令 ， 在 循环 内 的 指令 现在 只 需要 8 个 时 钟 周期 ， 一 共和 需要 8 x 200 = 1600 时 
钟 周期 。 


jdotpp.agm ASM Code with parallel instructions for fxed-point 


MVK .81 200, A1 count into Al 
ll ZERO -Li A7 rinit A? for accum 
LOOP LDH -D1 *Ad++,A2 ;A2-16-bit data pointed by A4 
I! LDH .D2 *H4++,B2 7B2=16-bit data pointed by B4 
'^ SUB $1 A1,1,A1 . idecrement count 
[A1] B .81 LOOP ;branch to LOOP (after ADD) 
NOP 2 idelay slots for LDH and B 
MPY Mix A2,B2,A5 iproduct in A6 
NOP . ;1 delay slot for MPY 
ADD -L1 A6,A7,A7 ;&ccum in A7,then branch 


branch occurs here 
图 8.6 使 用 并 行 指 令 ， 定 点 实现 点 积 的 汇编 程序 ( dotpp.asm ) 
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p87 使 用 汇编 程序 及 按 字 访 问 数据 (32 位 )， 定 点 实现 乘积 的 两 个 不 同 部 分 的 和 

图 8.7 是 汇编 程序 twosumfix.asm， 它 按 字 访问 数据 ， 采 用 定点 方式 ; 计算 乘积 的 两 个 不 同 部 
分 的 和 。 由 于 每 次 达 代 可 算出 两 个 乘积 的 和 , 循环 次 数 初始 值 设 为 100 (而 不 是 200)。 指令 LDW 
传送 一 个 字 或 一 个 32 位 的 数据 。 乘 法 指令 MPY 求 低 16 x 16 位 数据 的 积 ，MPYH SR 16 x 16 位 
数据 的 积 。 两 个 ADD 指令 分 别 计算 奇数 项 和 偶数 项 积 的 和 。 注 意 在 循环 外 面 需要 附加 一 条 ADD 
指令 来 累加 寄存 器 AT 和 B7 的 和 , 循环 内 的 指令 需要 8 个 时 钟 周 期 , 因此 现在 100 次 选 代 (不 是 
200) 4E% 8 x 100 = 800 个 时 钟 周期 。 


}twosumfis.asm ASM code for two sums of products with word-wide data 
:for fixed-point implementation 


MVK .S1 100, AL ;count/2 into A1 
ll ZERO Bl A? ;init A7 for accum of even terms 
ll ZERO .L2 BT rinit B7 for accum of odd terms 
LOOP LDW :D1 *Ad4++,A2 7A2=32-bit data pointed by Ad 
t LDW .D2  *B4««,.B2 7A3=32-bit data pointed by Bå 
sus .SI Al1,1,A1 idecrement count 
[A1] R .Sl LOOP ibranch to LOOP (after ADD) 
NOP 2 idelay slots for both Low and B 
MPY .Mix A2,B2,A6 slower 16-bit product in A6 
IL MPYH .M2x  A2,B2,B6 upper 16~bit product in B6 
NOP f ji delay slot for MPY/MPYH 
ADD „Ll — A6,A7,A7 ;accum even terms in A7 
li ADD . .L2 —B6,B87,B7 raccum odd terms in B? 


;branch occurs here 





”图 8.7 定点 实现 32 位 数据 乘积 两 部 分 和 的 汇编 程序 (twasumfix.asm ) 


例 8.8 不 采用 并 行 指令 ， 利 用 汇编 程序 和 浮 点 方式 实现 点 积 

图 8.8 是 汇编 程序 dotpnpfloat.asm、 该 程序 没有 并 行 指令 , 采用 浮 点 方式 实现 点 积 运算 。 循环 迄 代 
200 次 。 单 精度 浮 点 指令 MPYSP 执行 32 x 32 位 的 乘法 ,每 个 MPYSP 和 ADDSP 指令 需要 三 个 延迟 
时 险 ， 循 环 中 的 指令 每 次 选 代 总 共 需 要 18 个 时 钟 周期 (不 包括 与 ADDSP 相关 的 三 个 NOP 指 令 ), 这 
样 总 共 需 要 18x 200=3600 个 时 钟 周期 (参见 表 8.4, 它 概括 了 定点 与 浮 点 实现 的 几 种 优化 方案 性 能 。) 


18otpnpfioat.aum ASM with no parallel instructions for floating-point 


MVK $1 200, AL ;count into A1 
ZERO Ll AT ¿init A7 for accum 

LOOP LOW .Di *R444+,A2 jAZ=32-bit data pointed by Ad 
LDW .D1 *AB++, A3 ;À3232-bit data pointed by Ag 
NOP. 4 | 74 delay slots for LDW 
MPYSP .M1 A2,A3,A6 product in A6 . 
NOP - 3 ' 13 delay slots for MPYSP 
ADDSP .L1 A6,A7,A7 7accum in AT 
SUB -51 Al,1,A1 ; decrement count 

{Al] B .82 LOOP :branch to LOOP 


NOP 5 i5 delay slots for B 


$$ OES oD 0000 
图 8.8 没有 并 行 指令 ,采用 溯 点 方式 实现 点 积 的 汇编 程序 ( dotpnpfloat.asm ) 
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例 89 使 用 汇编 程序 及 并 行 指令 ， 浮 点 实现 点 入 

8.9 是 汇编 程序 detppfloatasm， 它 使 用 并 行 指令 ， 采 用 浮 点 方式 实现 点 积 。 循 环 选 代 200 
次 。 通过 将 SUB A B 指令 移 到 程序 前 面 代替 一 些 NOP 指令 , 使 得 循环 中 指令 的 数目 降 到 10 条 。 
TER: 在 循环 外 面 需要 三 个 附加 的 NOP 指令 以 得 到 ADDSP 的 结果 。 循环 中 的 指令 每 次 迭代 需要 
10 个 时 钟 周期 ， 因 此 总 共和 需要 10x 200 = 2000 次 时 种 周期 。 





Jüotppüoat.axne ASM Code with parallel iüstructions for floating-point 


MVK -51 200, A1 ¡count into Al 
ll ZERO Li A7 ;init A? for accum 
LOOP LDW .D1 *Ra++,A2 _, ;A2-32-bit data pointed hy A4 
ll LDW .D2 *B4++,B3 . 7B2=32-bit data pointed by B4 
SUB .Si A1,1,A1 idecrement count 
NOP 2 delay slots for both LOW and B 
[A1] B -52 LOOP ¿branch to LOOP [after ADDSP) 
MPYSP .Mix . A2,B2.A6 ;product in A6 . 
NOP 3 13 delay slots for MPYSP 
ADDSP -L1 A6,A7,A7 ;accum in A7,then branch 


;branch occurs here 
图 8.9 使 用 并 行 指 令 ， 采 用 浮 点 方式 实现 点 积 的 汇编 程序 dotppfloat.asm ) 


818.0 ”使 用 汇编 程 库 及 双 字 (64 位 数据 访问 方法 ， 浮 点 实现 秉 积 两 部 分 的 和 

图 8.10 是 汇编 程序 fwosumfloatasm， 它 使 用 双 字数 据 访问 方法 ， 浮 点 实现 的 乘积 两 部 分 之 和 。 
由 于 一 次 送 代 可 以 算出 两 个 乘积 的 和 ， 循 环 计数 器 初始 值 设 为 100。 指 令 LDDW 将 一 个 64 位 双 字 
数据 传送 到 一 寄存 器 对 中 ; RIEA MPYSP 执行 32 x 32 位 乘法 ; 两 个 ADDSP 指令 分 别 计算 奇数 
项 和 偶数 项 积 的 和 。 在 循环 外 面 需 要 附加 一 个 ADDSP 指令 来 票 加 寄存 器 A7 与 B7 的 和 。 一 个 循环 
中 的 指令 共 需 10 个 时 钟 阅 期 ， 现 在 选 代 100 次 ( 不 是 200 次) FEF 10x 100 = 1000 个 时 钟 周期 。 


jtwosumfloat.ama ASM Code for two sums of products for floating-point 





MVE .81 100, A1 ;count/2 into Al 
li ZERO .ET AT :init A7 for accum of even terms 
I ZERO .L2 ^ B7 rinit B7 for accum of odd terms 
LOOP LoDW .Di *“A4++,A3:A2 ;64-bit into register pair A2,A3 
tt LDDW -D2 *B4++,B3:B2 ;64-bit into register pair B2,B3 
SUB .Sl A1,1,A1 ;decrement count 
NOP 2 :delay slots for LIW ~ 
[A1] B .82 LOOP ;branch to LOOP 
MPYSP Mix A2,B2,ÀA5 ;lower 32-bit product in A6 
ii MPYSP .M2x — A3,B3,B6 rupper 32-bit product in 36 
NOP 3 13 delay slot for MPYSP 
ADDSP Ql A6,A7, A7 accum even terms in A7 
Il ADDSP .L2 B6,B7,B7 vaccum odd terms in B7 
:branch occurs here l 
NOP 3 idelay slots for last ADDSP 
ADDSE .Llx . A7,B7.A4 ifnal sum of even and odd terms 
NOP 3 idelay slots for ADDSP 
ory slots for ADDSP Oooo 


图 8.10 ”采用 浮 点 方式 实现 乘积 两 部 分 的 和 的 汇编 程序 ( iwosumfloat.asm ) 
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8.5 程序 优化 的 软件 流水 线 方法 


软件 流水 线 方法 是 一 种 高 效 的 汇编 语言 编程 方法 ， 它 可 使 在 一 个 时 钟 周 期 利用 所 有 的 功能 单 
元 。-02 和 -03 优化 级 别 可 使 程序 代码 生成 (或 试图 生成 ) 软件 流水 线程 序 代 码 。 
软 忻 流水 线 方 法 有 下 面 三 个 相关 的 阶段 : 
1. 开始 部 分 { 准备 部 分 )。 该 阶段 包含 建立 循环 内 核 ( 周期 ) ARES. 
2. TAK (周期 ) 在 循环 中 ， 所 有 指令 都 是 并 行 执行 的 。 由 于 所 有 指令 在 循环 内 核 阶段 
都 是 并 行 的 ， 所 以 整个 循环 内 核 在 一 个 时 钟 周 期 内 执行 。 
3， 结 尾部 分 【收尾 部 分 )。 该 阶段 包含 完成 所 有 迭代 所 必需 的 指令 。 


8.5.1 “手工 编制 软件 流水 线程 序 的 过 程 


1. 绘制 关联 图 。 
2. 建立 进程 时 序 表 。 
3， 由 进程 时 序 表 获得 程序 代码 。 


85.2 ”关联 图 
图 8.11 给 出 了 一 幅 关 联 了 图 。 绘 制 一 幅 关 联 图 的 步骤 如 下 : 


1.， 画 出 节点 和 路 径 。 

2.， 写 出 完成 一 条 指令 所 需 的 时 钟 周 期 数 。 

3. 给 每 个 节点 分 配 功 能 单元 。 

4. 分 离 数 据 路 径 ， 以 便 使 用 最 大 数目 的 功能 单元 。 


(a) 初始 阶段 





图 8.11 点 积 的 关联 图 


一 个 节点 有 一 个 或 老 个 数据 路 径 进入 或 离开 ， 临 近 节点 的 数字 表示 完成 相关 指令 所 需 的 时 钟 
周期 数 。 一 个 父 节点 包含 一 条 写 人 变量 的 指令 ， 而 一 个 子 节点 包含 一 条 读 取 变 量 指令 ， 该 变量 是 
由 父 节点 写 人 的 。 

由 于 两 条 LDH 指令 的 结果 被 MPY 指令 利用 , 所 以 LDH 指令 被 认为 是 MPY 指令 的 父 节点 ; 类 
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iki, MPY 为 ADD 指令 的 父 节 点 。ADD 指令 反馈 回来 作为 下 次 选 代 的 输入 ， SUB 指令 也 类 似 。 
图 8.12 给 出 了 另 一 幅 关 联 图 ， 它 用 定点 实现 乘积 的 两 部 分 之 和 。 在 图 8.12 中 ， 开 始 部 分 路 
径 长 度 是 关联 图 中 路 径 最 长 的 一 部 分 、 因 为 最 长 的 路 径 长 度 为 8、 开始 部 分 在 第 8 时 钟 进 人 循环 
AR (周期 ) 之前， 因此 开始 部 分 的 长 度 为 7。 
类 似 地 ， 用 LDW，MPYSP 和 ADDSP 指令 分 别 代替 图 8.12 中 的 LDH，MPY 和 ADD 指令 ， 
可 获得 泽 点 实现 的 关联 图 。 注 意 ， 单 精度 指令 MPYSP 和 ADDSP 都 需要 4 个 时 钟 周期 来 执行 完 
(每 条 指令 需要 三 个 延迟 时 隙 )。 





8.12 BRERA BRS MSR 
8.53 ”进程 时 序 表 
表 8.1 是 依据 关联 图 所 做 出 的 进程 时 序 表 。 
1. LDW 从 第 1 个 时 钟 周期 开始 执行 。 | 
2. 由 于 有 4 个 延迟 时 阶 ，MPY 和 MPYH 指令 必须 在 LDW 之 后 5 SORTA, ER 
IE MPY 和 MPYH 在 第 6 个 时 钟 开 始 执行 。 
3， 由 于 有 1 个 延迟 时 隙 ，ADD 指令 必须 在 MPY/MPYH 指令 之 后 2 个 时 钟 周期 开始 执行 ， 
因此 ADD 指令 在 第 8 个 时 钟 周期 开始 执行 。 
4. B 指令 有 5 个 延迟 时 隙 , 它 在 第 3 个 时 钟 周期 开始 执行 ， 分 支 转移 发 生 在 第 9 个 时 钟 周期 
开始 ， 即 在 ADD 指令 后 。 
5. SUB 指令 必须 分 支 指令 前 一 个 时 钟 周期 开始 执行 ， 因 为 在 分 支 转 移 产 生 之 前 ， 循环 计数 
A8 1， 所 以 SUB 指令 在 第 2 个 时 钟 周期 开始 执行 。 
从 表 8.1 可 以 看 出 ， 两 条 LDW 指令 是 并 行 执行 的 ， 分 别 在 第 L 9, 17, … 时 钟 周期 执行 ，SUB 
指令 在 第 2, 10, 18, … 时 钟 周期 执行 ， 紧 接着 是 分 支 指令 (BO 在 第 3, 11,19, … 时 钟 周期 执行 ， 两 个 
并 行 指令 MPY 和 MPYH 在 第 6, 14, 22,… 时 钟 赔 期 执行 ,ADD 指令 在 第 8, 16, 24, … 时 种 周期 执行 。 
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3X8.1 利用 软件 流水 线 方法 前 ， 定 点 实现 点 积 的 进程 时 序 束 


单元 19. 2,10,--- 3,11, -- 4,12,:- 5,13,.-- 6,14, ` 7,15, 8,16, 








M1 MPY 
.M2 MPYH 


Sl SUB 

32 B 

为 了 说 明 三 个 不 同 阶段 ， 开 始 部 分 (第 1 到 第 7 时 钟 周期 )、 内 核 部 分 (第 8 时 钟 周 期 } 和 
结尾 部 分 (第 9, 10, … 时 钟 周期 ， 不 -一 列 出 )， 将 表 8.1 扩展 成 表 82 所 示 的 形式 。 开 始 部 分 和 
循环 内 的 指令 依次 重复 执行 ， 结 尾部 分 的 指令 (第 9,10,… 时 钟 局 期 ) 完成 程序 的 最 终 功能 。 

AR 8.2 可 获得 高 效 的 程序 代码 。 注意 ,在 前 面 的 选 代 完成 之 前 , 有 可 能 开始 处 理 新 的 选 代 。 
使 用 软件 流水 线 方 法 可 确定 下 一 个 新 的 循环 选 代 开 始 时 间 。 


R82 利用 软件 流水 线 方法 后 ， 定 点 实现 点 积 的 进程 时 序 表 














m 期 
开始 阶段 RUA 

单元 1 2 3: 4 5 6 7 B 
D1 LOW LOW LDW LDW LDW LDW LDW LDW 
D2 LDW LDW LDW LDW LDW LDW LDW LDW 
MI MPY MPY MPY 
M2 MPYH MPYH MPYH 
L1 ADD 
L2 ADD 
Si SUB SUB SUB SUB SUB SUB ' SUB 
§2 B B B B B B 





循环 内 核 (周期 ) | 

TRA 8 个 时 钟 周 期 ， 每 个 功能 单元 只 使 用 一 次 。 最 小 选 代 间隔 时 间 是 指 开始 下 __- 
个 这 代 之 前 所 需 等 待 的 最 小 时 钟 周 期 数 。 由 于 该 时 间 间 隔 是 1 个 时 钟 周 斯 ， 因 此 每 个 时 钟 周 期 启 
动 一 次 新 的 选 代 。 

在 循环 内 核 内 第 8 个 时 钟 周期 循环 的 多 次 选 代 并 行 执行 。 在 第 8 个 时 名 周期 的 相同 时 间 里 
SERRER. Din, ADD 数据 相 加 指令 是 第 1 次 迁 代 的 指令 ， 而 MPY 和 MPYH 数据 相 乘 
指令 是 第 3 次 选 代 的 指令 ，LDW 数据 传送 指令 是 第 8 次 选 代 的 指 今 ，SUB 指令 在 第 7 次 选 代 里 
使 计数 器 减 1，B 分 支 指令 是 第 6 次 迭代 里 的 指令 。 注 意 ， 要 相 乘 的 数据 在 数据 相 乘 周期 前 5 个 
时 钟 周 期 要 送 到 寄存 器 中 。 在 第 1 个 乘法 相当 前 , 第 5 个 将 要 相生 的 数据 就 已 经 传送 到 寄存 器 了 ， 
该 软件 流水 线 的 深度 是 8 次 迭代 。 


例 8.11 利用 软件 流水 线 方法 定点 实现 点 积 
该 例 使 用 软件 流水 线 方法 定点 实现 点 积 的 运算 。 从 表 8.2 可 以 很 容易 获得 如 图 8.13 所 示 的 江 
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编程 序 dotpipedfix.asm, PNK 100K, ERU SUGRRATRUR PETENS, Tea 
是 在 如 下 不 同 的 时 钟 周期 开始 执行 : 





1dotpipedfiz .mi ASM code for dot product with software pipelining 
;For fixed-point implementation 





¡cycle 1 
MVK -81 100, A1 ;loop count 
li ZERO bi A7 ;init accum A7 
li ZERO .L2 B7 :init accum B7 
ti LEW .Di *Ad++, A2 ;32-bit deta in A2 
ii LDW .D2 *Báct,B2 f32-bit data in B3 
zcycle 2 
li LDW -D1 *Ad++, A2 :32-bit data in A2 
ll LDW -D2 *Bd++,B2 #32-bit data in B2 
i| [1] suB .81 Al,1.ALl idecrement count 
cycle 3 
!l LDW -D1 "Ad++, AD . :32-bit data in A2 
M LDW .D2 *Bd++, B2 ;32-bit data in B2. 
[|j [Al] sus .81 A1,1.A1 ;decrement count 
\{ [AL] B -52 LOOP ;branch to LOOP 
ireyele 4 
Il LDW .Di *Ad++, A2 ' ;32-bit data in A2 
Il LEW : -D2 *B4++; BZ :32-bit data in B2 
| [Al] SUB .S1 A1,1,A1 ;decrement count 
| [A1] B .82 LOOP rbranch to LOOP 
ieyele 5 
| LOW -DÌ 5 *Ad++,A2 742-bit data in AZ 
H LDW -D2 *Bd++, B2 32-bit Bats in B2 
| [Al] SUB -S1 A1,1,A1 ;decremant count 
. | [A1] B .52 LOOP . ;branch to LOOP 
;cycle 6 ` f f 
li LDW -DL *Ad++,A2 32-bit data in AZ 
| Low .D2 *H4++, 52 32-bit data in B2 
l| [all sup .51 A1,1,A1 decrement count 
| [AL] B .82 LOOP | :branch to LOOP 
I MPY -Mx A2,B2,A6 ;lower 16-bit product into A6 
ll MPYH -M2x  B2,A2, B6 ;upper 16-bit product into B6 
rcycle 7 
i, LOW .D1 *Ad++,A2 :32-bit data in A2 
ll LDW .D2 *B4++, B2 :32-bit data in B2 
|| [A1] sug .81 A1,1,A1 rdecrement count 
| [A1] B .82 LOOP ;branch to LOOP 
H MPY : ‘Mix A2,B2,A6 ‘lower 16-bit product into A& 
I. MPYH .M2x | B2,A2,B6 ;Pupper 16-bit. product into B6 
;cycles 8-107 [loop cycle) ` 7 
Hu LDW .Di *A4e* A2 :32-bit data in A2 
|J LDW .D2 *Bd++,B2 :32-bit data in B2 
i [A1] sug .S1 Al,l1,Al decrement count 
|| (a1j B -52 LOOP . ¿branch to LOOP 
li MPY Mix — A2,B2,A6 slower 16-bit product into A6 
ll MPYH .M2x . B2,A2,B6 ;üpper 16-bit product into B6 
H ADD -L1 A6,A7,A7 raccum in AT 
| ADD .L2 B6,B7,R7 :accum in B7 


ibranch occurs here 
fcycle 108 (epilog) : 
ADD .Lix AT, B7, Aå ;final accum of odd/even 


图 8.13 利用 软件 流水 钱 方法 ， 定 点 实现 点 积 的 汇编 程序 dotpipedfix.asm ) 
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时 钟 周期 1: LOW, LOW ( 也 包括 计数 器 、 累 加 器 A7 和 B7 的 初始 化 ) 
时 钟 周期 2: LOW, LDW, SUB 

时 钟 周 期 3-$; LDW, LDW, SUB, B 

yt $b AH 6-7. LOW, LDW, MPY, MPYH, SUB, B 

时 钟 周 期 8-107; LDW, LDW, MPY, MPYH, ADD, ADD, SUB, B 
时 钟 周期 108. LDW, LDW, MPY, MPYH, ADD, ADD, SUB, B 


开始 部 分 执行 从 第 1 到 7 个 时 钟 周期 ; 循环 内 核 部 分 从 第 8 个 时 钟 周期 开始 执行 ， 这 里 所 有 
的 指令 都 是 并 行 执行 的 ;结尾 部 分 在 第 108 NSE A. TEM: SUB 指令 是 有 条 件 的 ， 保 证 At 
减 到 0 Ja AR ESB. 


例 8.12 利用 软件 流水 线 方 法 浮 点 实现 点 积 

本 例 采 用 软件 流水 线 方法 浮 点 实现 点 积 运算 ， 表 8.3 中 给 出 了 表 8.2 的 浮 点 实现 形式 。 相 
对 于 表 8.2, LDW 变 为 LDDW, MPY/MPYH 变 为 MPYSP, ADD 变 为 ADDSP, MPYSP 和 
ADDSP 都 各 有 3 个 延 返 时 孙 ， 因 此 ， 循环 内 核 从 第 10 个 时 钟 周期 开始 执行 (而 不 是 从 第 8 
个 时 钟 周 期 开始 执行 ) SUB 和 B 指令 分 别 从 第 4 个 和 第 5 个 时 钟 局 期 开始 执行 , 而 不 是 从 第 
2 个 和 第 3 个 时 钟 周 期 。ADDSP 从 第 10 个 时 钟 周期 开始 执行 ， 而 不 是 从 第 8 个 时 钟 周期 ， 因 
此 采用 浮 点 实现 方式 ， 渍 水 线 深度 为 10。 


£83 利用 软件 流水 线 方法 后 ， 浮 点 实现 点 积 的 进 穆 有 时序 


m 期 
开始 阶段 TAK 
单元 1 2 3 4 5 6 7 8 9 10 
Dl LDDW LDDW LDW LDDW LDDW LDDW LDDW LDDW LDDW LDDW 
D2  LDDW LDDW LDDW LDDW LDDW LDDW LDDW LDDW LDDW LDDW 


Mi MPYSP  MPYSP  MPYSP  MPYSP  MPYSP 
M2 MPYSP  MPYSP MPYSP  MPYSP  MPYSP 
Ll | MPYSP 
L2 | MPYSP 
Slc SUB SUB SUB SUB SUB SUB SUB 
S2 B 8 B B B B 





图 8.14 给 出 了 利用 软件 流水 线 技 术 浮 点 实现 点 积 的 汇编 程序 dotpipedfloat.asm, 由 于 ADDSP 
指令 有 3 个 延迟 时 了 由， 因此 辕 加 的 各 项 序号 之 间 相差 4。 在 每 个 循环 周期 ,， ADDSP 指令 相关 的 累 
加 内 容 如 下 : 


MHA RINT (单个 ADDSP) 





期 

1 0 

2 0 

3 0 

4 0 

5 pd ;第 1 个 乘积 
6 pl B 27 RR 





第 8 章 程序 优化 方法 
7 p3 
8 pa 
9 po+p4 26 1 个 和 第 5 个 乘积 的 和 
10 plt+p5 ;第 2 个 和 第 6 个 乘积 的 和 
11 p2+p6 
12 p3+p7 
13 pÜ 4 p4 * p& :第 1 个 、 第 5 个 和 第 9 个 乘积 的 和 
14 pl+p5+p3 
15 p2+p6+pl10 
16 p3+p7+pl1l1 
17 p0+p4+p8+pl2 
99 p2+p6+plo0+---+po4 


100 p3-tp7-c-pll-c--:4p95 


对 应 每 个 循环 周期 ， 给 出 了 各 周期 累加 的 过 程 ， 实 际 的 循环 周期 偏 移 了 9 个 时 钟 周期 【开始 
部 分 所 占 的 时 钟 周 期 ) 注意 的 是 : 因为 第 一 个 ADDSP 指令 从 第 1 个 循环 周期 开始 且 有 3 个 延迟 
时 隙 ， 因 此 第 一 个 乘积 po 在 第 5 个 循环 周期 才能 得 到 ， 它 和 低 32 位 项 有 关 ， 而 第 2 个 ADDSP 


(未 显示 出 来 ) 累加 高 32 位 部 分 的 乘积 之 和 。 


A6 包含 低 32 位 的 积 而 B6 包含 高 32 位 的 积 。 高 低 32 位 习 积 的 和 分 别 在 A7 和 B87 中 累积 。 


结尾 部 分 的 实际 时 名 周期 (不 是 指 循 环 周期 ) 包括 下 列 指令 ， 如 图 8.14 所 示 。 





;dotpipedftoat.agm ASM code for dot product with software pipelining 


:For floating-point implementation 


¡cycle 1 


peycle 2 


¡cycle 3 


peyecle 4 
[l LDDW 


;cycle 5 
I! LDDW 
Il LDDW 
|| (à1] SUB 


.81 
.L1 
„L2 
.Di 
.D2 


„Di 
.D2 


.Di 
.D2 


„Di 
.D2 
-51 


-D1 
-D2 
.S31 
.82 


100,A1 
AT 
B7 


*Ad4++,A3: 
*B4++, B3: 


SAd++,A3; 
*Bå++, B3: 


*Ad++, A3: 
*Bd++,53: 


R444, A3: 
*B4+4+,B3: 


AlL,1,Al1 


*A44+4,A3; 
*Hd++,3B3: 


Al,1,AÀ1 
LOOP 


¿loop count 


¿init accum A7 
init accum B7 


;54-bit data 
:64-bit data 


:64-bit data 
64-bit data 


:64-bit data 
64-bit data 


64-bit data 
64-bit data 


decrement count 


in 
in 


in 
in 
in 


in 


in 
in 


;64-bit data in A2 
764-hit data in B2 


;decrement count 


;branch to LOOP 


and 
and 


and 
and 


and 
and 


and 


and 


and 
and 
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poyele & 
中 LDDW .D1 *hAc*,A3:A2 ; 64-bit data in A2 and A3 
| LDDW .D2 *Rd++,B3:B2 ;64-bit data in B2 and B3 
| [AL] SUB .81 Al,1,A1 decrement count 
| [Al} B .82 LOOP :branch to LOOP 
[ MPYSP .Mix A2,B2,A6 lower 32-bit product into A6 
| MPYSP .M2x B3,A3,B6 ;upper 32-bit product into B6 
cycle 7 . f 
| LDDW :D1 *A4++,A3:A2  ;32-bit data in A2 and A3 
1] LDDw -D2 *B4++,B3:82 ;32-bit data in B2 and B3 
| [A1] SUB .81 Al,1,Al idecrement count 
| E41] B .82 LOOP ;branch to LOOP 
i| MPYSP .Mix A2,B2,A6 ;lower 32-bit product into A6 
| MPYSP Max B3,A3,B6 supper 32-bit product into B6 
:cycle 8 
| LDDW .D1 *Ad++,B3:A2 ;32-bit data in A2 and A3 
ll LDDW .D2 *Bá++,B3:B2 ;32-bit data in B2 and B3 
|| [A1] SUB .81 Al,1,Al ;decrement count 
ll [Al] B .82 LOOP ;branch to LOOP 
H MPYSP .Mlix A2,B2,.A6 - ;lower 32-bit product into A6 
MPYSP .M2x B3,A3,86 ;upper 32-bit product into B6 
;cycle 8 ; f 
LDDW .Di *Aàd--,A3:A2  ;32-bit data in A2 and A3 
LDDW .D2 *Ba++,B3:52  ;32-bit data in B2 and B3 
|| [A1] sus „51 A1,1,A1 ;decrement count | 
| [Al] B .82 LOOP ;branch to LOOP 
MPYSP f .Mix A2,82,À6 ;lower 32-bit product into A6 
MPYSP „MIX B3,A3,B6 upper 32-bit product into B6 
reyeles 10-105 {loop kernel! i . 
LDDW -D1 *A44++,A3:A2 ;32-bit data in A2 and A3 
LDDW .D2 *Bá^4,B3:B2  ;32-hit data in B2 and 83 
[Al] SUB .S1 Al,1,Al ;decrement count 
[Al] B . .82 LOOP ;branch to LOOP 
MPYSP .Mlx A2,B2,A6 ;lower 32-bit product into Aé 
i MPYSP .M2x B3,A3,B6 supper 32-bit product into B6 
ADDSP «LL AG, AT,AT ;accum in 五 了 
| ADDSP .L2 B6, B7, B7 accum in B7 





;branch occurs here 
;cycles 110-124 {epilòg} 


ADDSP .Lix A7,BT7,AÀ0 jlower/upper sum of products 
ADDSP .L2x A"7,B7,B0 i 

ADDSP i .L1x A7,B7,AD i 

ADDSP .L2x A7, B?, BQ ; 

NOP ;wait for 1* BO 

ADDSP .Llx AD,BD,A5 ;1'" two sum of products 
NOP ;wait for 2"* Bo 

ADDSP -LZE A0, BO, B5 jlast two sum of products 
NOE 3 i3 delay slots for ADDSP 
ADDSP „Lix A5, B5, A4 :final sum -— 

NOP . 3 73 delay siots for final sum 





图 8.14 利用 软件 流水 钱 方 法 ， 浮 点 实现 点 积 的 汇编 程序 ( dotpipedfloat.asm ) 
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循环 周期 ” 指令 

110 ADDSP 

111 ADDSP 

112 ADDSP 

113 ADDSP 

114 NOP 

115 ADDSP 

116 NOP 

117 ADDSP 

118-120 NOP 3 
121 . ADDSP 

122-124 NOP 3 


从 时 钟 周期 113 到 116, A7 内 保存 低 32 位 乘积 的 和 ， 而 B7 内 保存 高 32 位 乘积 的 和 ， 即 : 


循环 周期 A7( 包 含 低 32 位 ) 和 了 B7( 包 含 高 32 位 ) 
113 p0+p4+p8 +..4+ p96 
114 pl+p5t+p9+..+p97 
115 p2tp6+plo0t+..+p98 
116 p3itp7+pil+..+p99 
在 第 114 个 时 钟 周 期 ,可 得 到 40 = A7+ B7 的 值 。A0 累加 低位 和 高 位 部 分 的 乘积 的 和 。 这 里 ， 
A7 = pO + på + p8 +--+ p96 (4& 32 4i) 
B7 = pO + på + pë +--+ p96 (5832 f2) 
在 第 115 个 时 钟 周期 ， 可 得 到 B0 = A7 - B7 的 值 ， 这 里 : 
A7 = pl + p5 + p9 +…+B97 ( 低 32 位 ) 
B7 = pi + p5 + p9 +...+ p97 (高 32 位 ) 
类 似 地 ， 在 第 116 个 和 第 117 个 时 钟 周期 ， 可 得 到 AO 和 BO 的 值 如 下 : 


A0 = (p2 + p6 + plO +…+B98) 高 低 32 位 的 和 
BO = (p3 + p7 + pli +-…+ p99) 高 低 32 位 的 和 





在 第 119 个 时 钟 周期 ， 可 得 到 A5 = AO + BO (从 第 114 个 和 第 115 个 时 钟 半 期 得 到 } 的 值 ， 
在 第 121 个 时 钟 周期 ,可 得 到 B5 = A0+B0 {从 第 116 个 和 第 117 个 时 钟 局 期 得 到 ) 的 值 。 
最 终 的 和 在 寄存 器 AA 累加 ， 并 在 第 124 个 时 钟 周期 后 可 得 到 求 和 的 结果 。 


8.6 不 同 优化 方案 执行 的 时 钟 周期 比较 


Be 8.14 给 出 了 不 同 优化 方法 所 需 的 时 钟 周 期 情况 , 包括 定点 实现 和 浮 点 实现 方式 , 这 里 count 
= 200. 对 于 不 加 大 小 的 数组 由 于 开始 部 分 和 结尾 部 分 包含 的 时 钟 周期 数 是 相同 的 , 因此 总 的 时 
钟 周期 数 由 数组 的 大 小 决定 。 
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注意 ， 如 果 count = 1000, 利用 软件 流水 线 方法 ， 定 点 实现 和 浮 点 实现 所 需 的 时 钟 周期 数 如 下 。 


E: 7+ Ccount/2) +1 = 508 个 时 钟 周期 
POR: 9+ ( count/2) +15= 524 个 时 钟 周期 


R64 不 同 优 化 方法 定点 和 浮 点 实现 所 需 杰 的 时 钟 周期 数 〈count = 200) 





周期 数 
优化 方案 XE m 浮 点 
不 优化 2 + (16 x 200) = 3202 2 + (18 x 200) = 3602 
使 用 并 行 指令 1 (8x 200) = 1601 . 1 (0x 200)= 2001 
AU AOR Al 1+(8 x 100) = 801 1+(10 x 100) +7 = 1008 
使 用 软件 流水 线 操作 7 + (100}+ 1 = 108 9 + (100) + 15 = 124 
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这 一 章 可 当做 实验 . 学 生 的 课题 和 DSP 应 用 的 资料 ， 也 可 以 作为 文献 9 了 的 参考 。 C30 和 C31 
浮 点 处 理 器 上 并 及 TMS320C25 定点 姓 理 器 8 "本 已 广泛 应 用 于 多 种 工程 课题 中 , 涉及 通信 、 控制 及 
神经 网 络 等 应 用 领域 ,这 些 课题 可 作为 其 他 工程 应 用 的 参考 。TI 公司 每 年 出 版 的 论文 集中 ,包含 
了 许多 基于 TMS320 系列 数字 信号 处 理 器 的 论文 ， 这 些 论 文 可 为 其 他 工程 项 目 提供 很 好 的 借鉴 。 
TI 公司 网 站 上 有 一 系列 学 生 的 课程 设计 ,内 容 涵 盖 的 应 用 范围 很 宽 ,这些 课题 已 成 为 T 公 司 “DSP 
和 模拟 设计 挑战 赛 ”的 决赛 内 容 ( 一 等 奖 奖 金 为 100 000 美元 ),， 另 外, 第 6 章 、 第 7 章 和 附录 D 
至 附录 R 的 内 容 也 是 非常 有 用 的 。 

感谢 所 有 为 写 这 一 章 提 供 素 材 的 学 生 ， 包 括 来 自 Roger Williams 大 学 和 : Massachusetts- 
Dartmouth 大 学 的 学 生 ， 他 和 们 为 我 的 BSP 应 用 内 容 提供 了 大 部 分 的 应 用 背景 ， 尤 其 是 参加 我 的 研 
究 生 课程 一 一 基于 C6x 的 实时 数字 信和 号 处 理 器 的 学 习 , 来 自 Worcester Polytechnic Institute ( WPI ) 
的 学 生 : Y. Bognadov, J. Boucher, G. Bowers, D. Ciota, P. DeBonte, B. Greenlaw, S. Kintigh, R, 
Lara-Montalvo, M. Mellor, F. Moyse, A. Pandey, I . Progri, V. C. Ramanna, P. Srikrishna, U. 
Ummethala #1 L. Wan。 本 章 对 他 们 的 课题 (以 及 一 些小 课题 ) 进行 了 简要 的 讨论 。 第 6 BAB 7 
章 讨论 了 自 适 应 滤波 和 图 像 均 街 器 两 个 课题 。 


9.1 使 用 DMA 和 用 户 开关 的 话音 扰乱 器 


ID scrami6k_sw ( 在 辅助 材料 中 ) 是 例 4.9 的 扩展 ， 它 使 用 了 三 个 拨 码 (DP) 开关 : 
USER_SW1 到 USER SW3, DSK REA 4 个 这 样 的 开关 ( 而 第 四 个 开关 没有 使 用 )。 当 语音 信号 
输入 时 ， 根 据 用 户 开关 的 设置 ， 输 出 可 以 是 非 扰 乱 的 语音 信号 。 

用 户 的 DIP 开关 用 于 决定 是 否 上 抽样 。 根 据 开 关 的 位 置 ， 程 序 可 以 作为 环 路 或 滤波 程序 。 
USER_SW1 对 应 最 低 有 效 位 (1SB )， 如 程序 中 第 一 个 测试 的 设置 开关 设置 为 “下 /下 /十 ”， 表 示 
{001)。 如 果 测 试 条 件 为 真 ， 输 出 是 16 kHz 上 抽样 的 话音 扰乱 信号。 下 面 是 开关 位 置 设置 与 功能 
WER : 


USER SW1. . USER SW2 USER, S5W3 
Ü 





输出 F, = 16 kHz 的 扰乱 语 音信 号 
输出 F,= 16 kHz 的 未 扰乱 的 语音 信和 号 
F,-16kHz 的 低 通 滤波 

输出 F, = 8 kHz 的 扰乱 语音 信号 

输出 F,= 8 kHz 的 未 扰乱 语音 信号 

F, = 8 kHz 的 低 通 滤波 

环 路 程序 


wmf eo F Bf 
= Oo mM © = m 
D O —= Fe fF SS 
> = = 
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scramBk_ DMA 

另 一 个 替代 的 课题 scramBk_DMA (在 辅助 材料 中 ) 使 用 了 DMA 方法 和 8kHz 的 抽样 频率 ， 
实现 了 语音 信号 的 扰乱 。 它 是 由 DSK 工具 包 中 codec_edma 的 傅 子 经 过 修改 而 成 的 ， 该 程序 演示 
了 使 用 DMA 以 及 选择 不 同 设置 ， 实现 环 路 程序 、 尖 波 或 语音 扰乱 ( 没有 上 抽样 ) 等 不 同 的 功能 。 


9.2” 锁 相 环 


锁 相 环 课题 实现 了 基于 软件 的 线性 链 相 环 路 ( PLLO, 基本 锁 相 环 使 一 个 特定 的 系统 去 跟踪 另 
一 个 锁 相 环 。 锁 相 环 包括 相位 检测 器 …. 环 路 渤 波 哄 和 压 控 振 昔 器 。 软 件 锁 相 环 更 为 通用 ， 功 能 也 
更 强大 ， 但 覆盖 的 频率 范围 有 限 ， 这 是 由 于 在 每 个 输 人 信号 周期 ， 输 人 信和 号 必须 至 少 执 行 一 次 锁 
相 环 的 功能 外 剖 ， 也 就 是 要 进行 相应 的 运算 ， 

最 初 ， 锁 相 环 是 用 MATLAB 编写 测试 的 ， 然 后 再 使 用 C 编程 移植 到 C6x 上 。 锁 相 环 锁定 到 
由 程序 内 部 或 者 外 部 信号 源 产 生 的 正弦 波 圭 ， 和 输出 信号 显示 在 示波器 上 或 使 用 DSP/BIOS 的 实时 
数据 传输 (RTDX ) 工具 传输 到 PC 上 进行 观察 。 

图 9.1 给 出 了 两 种 形式 线性 锁 相 环 的 原理 框图 。 


L 使 用 外 部 输入 信号 源 ， 数 控 振荡 器 (DCO) 的 输出 作为 示波器 的 输入 ， 
2、 由 查 表 方 法 产生 正弦 波 ， 使 用 RTDX 工具 以 及 用 Excel 观察 不 同 信号 。 


外 部 
AIR 


Toi 
VRE 





图 9.1 PLL 的 原理 框图 


图 9.1 的 相位 检测 器 将 输入 的 正弦 信号 与 DCO 输出 的 方 波 信号 相 莱 , 得 到 两 个 输出 信号 ,一 
个 信号 频率 是 两 个 输入 信号 频率 的 和 ， 另 一 个 是 两 个 输入 信号 频率 的 差 ， 前 者 对 应 的 是 高 频 输 出 
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分 量 ， 后 者 对 应 的 是 低频 输出 分 量 。 低 频 分 量 用 于 控制 环 路 ， 而 高 频 分 量 则 被 环 路 滤波 器 滤 除 。 
当 锁 相 环 路 锁定 时 ， 相 位 检测 器 的 两 个 输 和 人 信号 是 同 频率 的 正 交 (90 HE) 信和 号。 

环 路 滤波 髓 是 一 个 低 通 滤波 器 ， 它 允许 相位 检测 器 输出 的 低 睹 分 量 通过 ， 抑 制 不 需要 的 高 频 
分 量 。 环 路 滤波 器 是 单 零 点 单 极点 的 IR 滤波 器 ， 零 点 的 作用 是 提高 环 路 的 动态 特性 和 稳定 性 。 
环 路 滤波 器 定 标的 输出 表示 DCO 相位 的 瞬时 增 量 。DCO 输出 方 波 可 以 是 Walsh AK: +H 表示 相 
位 在 0~ r 之 间 ， 而 -!1 表示 相位 在 -x -0 之 间 ， 相 位 增 量 与 输入 的 数据 成 比例 。 


921 RTDX 用 于 实时 数据 传输 工具 


RTDX 用 于 向 PC 传输 数据 , 而 PC 用 查 表 方法 生成 的 正 汞 波 作为 输 和 人 信 生 。 输出 通道 把 输入 
信号 、 环 路 滤波 器 种 DCO 的 和 输出 信号 以 及 时 间 惟 传输 到 CCS. CCS 组 种 这 些 数据 ， 以 便 其 他 应 
用 程序 能 读 取 这 些 数据 . CCS 有 一 个 接口 ,使 PC 应 用 程序 能 访问 缓冲 的 RTDX 数据 。 Visual Basic 
Excel (LABVIEW 和 Visual C+ 也 可 以 ) 用 于 在 PC 显示 器 上 显示 结果 。 


9.3 SB-ADPCM 编 解 码 器 : G.722 语音 编码 器 的 实现 
音频 信号 以 16 kHz 的 速率 进行 抽样, 数 据 传输 速率 为 64 tbitsle, 在 接收 端 重建 音频 信号 Pa 


编码 器 

子 带 自 适应 差分 脉冲 编码 调制 器 ( SB-ADPCM ) 由 正 交 蚀 像 发 送 滤 波 器 组 成 ， 它 将 输入 信号 
分 成 一 个 0-4 kHz 的 低频 信息 和 一 个 4~8 kHz 的 高 频 信 号 。 低 独 和 高 频 信 和 号 分 别 对 各 自 自 适应 预 
测 器 输出 的 误差 信号 进行 动态 量化 和 编码 ， 丙 个 误差 信号 分 别 用 6 位 和 2 位 进行 编码 。 只 楼 误差 
信和 号 足够 小 ， 总 的 量化 噪声 就 可 以 忽 咯 ， 系 统 人 性 能 就 能 保证 较 好 。 将 低频 和 高 频 两 部 分 的 编码 信 
号 复 接 后 ， 就 变 成 8 kHz 抽样 率 8 位 的 信和 号， 这 样 数据 速率 就 变 成 64 kbitsjs。 图 9.2 给 出 了 
SB-ADPCM 编码 器 的 原理 框图 。 

16 tk, AXE 2 fi, Wis 


为 8kHz, 或 X 8 kHz., 或 
128 khits/s 





16 位， 频率 
H 16kHz, HE 
_ 256 kbits/s 






”8 位 ， Wok 
为 8kHz, 或 
64 kbit/s 







16 位 采样 频率 
为 8kHz, 或 
128 kbits/s 




















图 9.2 ADPCM 编码 器 的 原理 框图 


TER RE 
正 交 镜像 发 送 滤波 器 ( QMF ) 接收 速率 为 16 kHz 的 16 位 抽样 ， 然 后 把 它 分 成 低频 和 高 频 信 
号 两 部 分 。 滤波 器 系数 表示 A KHz A ES 抽样 信号 分 成 奇 抽样 和 侦 抽 样 ， 频率 在 4 ~8 kHz 
之 间 的 信号 有 混 全 效应。 这 种 混 竺 效应 使 高 频 奇 抽样 和 高 频 偶 抽样 的 祖 位 差 为 180 度 ， 而 低频 的 
奇 、 侦 抽样 是 同 相 的 。 当 奇偶 信号 相 加 时 ， 经 过 滤波 器 后 低频 信号 之 间 奇 侦 抽样 相 加 ， 而 高 频 信 
号 之 间 奇 偶 抽 样 相互 抵 销 ， 生 成 抽样 率 为 8 kHz 的 低频 信号 。 
低频 子 带 编码 器 将 从 QME 输出 的 低频 信号 转换 成 一 个 误差 信号 , 并 量化 成 6 位 的 数字 信号 。 
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解码 器 

如 图 9.3 所 示 ， 解 码 器 将 64 kbits/s 信和 导 分 成 两 部 分 信 导 ， 分 别 输 人 到 低频 和 高 频 的 子 带 SB- 
ADPCM 解码 器 。 正 交 镜像 接收 滤波 器 (OMRE) 由 两 个 数字 滤波 器 组 成 ， 对 低频 和 高 频 子 带 
ADPCM 解码 器 的 8-16 kHz 信号 进行 插值 , 生成 速率 为 16 kHz 的 信和 号。 在 高 频 SB-ADPCM 解码 
器 中 ,将 量化 误差 信和 导 与 估计 的 信号 相 加 来 重 构 信 号 。 


16 kbits/s 





图 93 ADPCM 解码 器 的 原理 框图 


ADPCM 解码 器 的 解码 过 程 包括 逆 自 适应 量化 器 、 量 化 器 调整 、 自 适应 预测 、 预 测 值 计算 和 
重 构 信 号 计算 .用 CD 播放 器 播放 的 信号 作为 输入 ,可 以 昕 出 DSK 重 构 的 输出 依 呈 音质 是 较 好 的 。 
通过 比较 缓冲 的 输入 数据 和 重 构 的 输出 数据 ， 也 辐 以 说 明 解 码 医 的 结果 是 较为 理想 的 。 


9.4” 自 适应 时 域 衰减 器 


自 适应 时 域 衰减 器 (ATA ) 抑制 不 需要 的 论 带 信号 ， 以 获取 最 大 的 信 干 比 。 图 9.4 是 自 适应 时 
域 误 减 器 的 原理 框图 。 输入 通过 延 时 单元 , 从 选择 的 延迟 单元 输出 的 信号 经 过 系数 加 权 , 输出 为 : 


yk} =m? -rk]= Yo. rik -i]) 
其 中 四 是 权重 系数 矢量 ，r 是 从 输 人 信和 号 中 选 出 的 延迟 抽样 泉 量 ，N 是 了 和 * 中 抽样 点 的 数目 。 自 
适应 算法 基于 相关 算 阵 和 方向 矢量 计算 加 权 系 数 : 
C[k,8 = 0]- m[k] - AD 
Sth CEER, D 是 方向 矢量 , MELART. 相关 矩阵 C 是 在 几 个 抽样 周期 的 信 叶 相关 的 均值 ; 


Clk.8] - x. $ (teris a] ) 


这 里 Nav 是 在 均值 计算 中 样本 的 数目 。 方 向 矢量 DD 表示 期 望 的 信和 号: 
D=[1 exp(jo;t) --- expjor(N -De 


@z 是 期 望 信号 的 角 频 率 ，? 是 输出 样本 之 问 的 延 时 ， 六 是 相关 矩阵 的 阶 数 。 ， 
”该 过 程 使 干扰 信号 与 期 望 的 信号 之 比 ( UDR ) Ko, UDR 定义 为 信号 总 功率 与 期 望 信号 
功率 之 比 ， 也 就 是 ; 


UDR = Pes. mA] -C[k, 0}- mik) _ i 
Pa P(w k] -D) | P,(m[k] =D) 
其 中 已 是 期望 信 号 的 功率 。 - 
用 MATLAB 对 自 适应 时 域 套 减 器 进行 仿真 ， 然 后 再 把 它 传 输 到 Cox 中 实时 实现 。 图 9.5 给 
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出 了 使 用 频率 为 1416 Hz 期 望 信号 和 1784 Hz TRS ( 可 以 改 为 其 他 频率 信号 ) 的 测试 配置 框 
图 。 用 MATLAB 找到 能 使 UDR 最 小 化 的 最 佳 Y 值 ， 困 为 使 用 该 7 值 《 随 GEL 文件 而 改变 ) 可 使 
THES (最初 显示 在 HP3561A 分 析 侈 上 ) 极 大 地 衰减 。 关 于 这 一 点 ， 在 实时 处 理 中 也 得 到 了 
验证 。 i 





clhs]= - Ys lelerte—o7) 
C{k, 6 = 0]-m[t] ap 
m(k]= a(clk,6 2 o] D 






图 94 AGAVE CRISE RE PE 


期 望 的 信号 
万 =1416 Hz 







不 期 望 的 信和 号 
f, 7 1784 Hz 






图 9.5 自 适 应 时 域 衰 减 器 的 测试 配置 图 


9.5 图像 处 理 
本 课题 实现 了 图 像 处 理 中 使 用 的 多 和 神 方 案 : 


. 边缘 检测 ， 使 用 Sobe 的 边缘 检测 来 增强 图 像 的 边缘 。 

.中 值 滤波 ， 非 线性 滤波 器 滤 除 图 像 中 的 尖 妖 噪声 。 
直方 图 均衡 ， 利 用 图 像 谱 。 

. 图 怕 模 糊 谈 荐 ， 空 间 滤 波 器 锐 化 图 像 ， 增 强 图 像 的 高 频 分 量 。 
5， 点 检测 ， 增 强 图 像 中 单 点 特点 。 


主要 间 题 是 : ( 由 于 学 期 课程 时 间 的 限制 ), 使 用 /调用 像 的 图 像 文件 ， 而 不 是 使 用 实时 图 像 。 
在 该 课题 期 间 ， 同 时 开发 了 下 面 一 些 算法 程序 : 均值 、 方差 可 调 的 加 性 高 斯 噪声 的 程序 实例 以 及 
将 某 种 概率 分 布 的 一 组 数据 映射 为 另 一 种 不 同 分 布 的 直方 图 变换 程序 实例 (用 于 图 像 处 理 中 小 


b ww W = 
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9.6 ”用 改进 的 Prony 方法 设计 和 实现 滤波 器 


本 课题 是 基于 改进 的 Prony 方法 来 设计 和 实现 滤波 则 的 62261。 这 种 方法 基于 涉 波 器 表示 的 相 
关 性 ， 不 需要 任何 微分 计算 或 系数 矢量 初始 估 值 、 利 用 递 推 的 方法 计算 滤波 器 的 系数 ， 得 到 滤波 
器 的 冲 激 响应 。 


9.7 FSK 调制 解 调 器 


本 课题 实现 了 一 个 数字 调制 解 调 器 ， 它 产生 8 进 制 的 FSK 载波 信号 。 程 序 执行 步 又 如下， 


.把 采集 的 数据 作为 输入 六 号; 

. 将 6 个 最 重要 前 比 特 分 成 两 个 3 比特 的 抽样 ; 

. 抽样 数据 最 重要 的 3 比特 选择 一 个 频率 的 FSK 载波 信和 号; 

. FSK 载波 送 给 解 调 器 ; 

. FSK 载波 加 Hanning AAK: 

， 对 加 窗 的 FSK 载波 信号 进行 (16 点 ) DFT 运算 ; 

-DFT 运算 的 结果 送 给 频率 选择 函数 ， 它 选 择 旺 度 最 高 的 频率 ， 而 该 频率 对 应 抽样 数据 的 
高 3 位 ; 

8， 对 抽样 数据 的 次 重要 3 比特 重复 上 上述 过 程 ; 

9， 高 和 低 3 比特 合并 送 给 编码 /解码 器 ; 

10. GEL 程序 有 一 个 选项 ， 用 来 插值 或 上 抽样 重 构 的 数据 以 得 到 更 平滑 的 输出 波形 。 
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诸如 将 语音 这 样 的 模拟 输 和 人 信和 号 转换 成 数字 信和 叶 并 压缩 成 8 比特 数据 ，h 律 编码 就 是 一 种 针 
对 语音 信号 进行 对 数 压缩 非 均 匀 量 化 的 方案 。 在 美国 ， 语 音信 号 进行 编码 传输 时 ， 先 采用 h 律 对 
信号 进行 对 数 形式 的 压缩 ， 以 便 在 不 提高 数据 量 的 前 提 下 提高 信忠 比 ， 这 种 方法 现在 在 电信 领域 
被 广泛 应 用 。 

尽管 量化 的 位 数 保持 不 变 , 但 动态 范围 增加 了 ,b 律 压缩 的 语音 信号 一 般 用 8 比特 抽样 数据 表示 ， 
它 携带 小 信和 号 的 信息 量 要 比 大 信和 号 的 信息 量 多 。 采 用 压缩 技术 基于 这 样 的 事实 : 从 统计 意义 上 来 讲 ， 
信号 更 可 能 在 小 信和 号 区 间 ， 而 不 是 在 大 信和 叶 区 间 ， 因此， 在 小 信号 区 间 需 要 更 多 的 量化 点 数 。 . 

查找 表 内 共有 256 个 数 ”, 它们 分 别 用 来 获得 0 到 7 括 的 量化 电 平 , 该 表 由 15 x 16 组 数组 成 ， 


0 段 间隔 为 2 
1 段 间隔 为 2 
2 段 癌 隔 为 4 
3 段 间 陋 为 8 
4 上段 间隔 为 16 
5 BEMA 32 
6 BEIBIBR AS 64 
7 BBRA 128 


oh h b wW Ho e 


(D 译 者 注 ， 书 中 这 段 描 述 与 给 出 的 家 没有 对 应 关系 ， 可 参照 PCM HERE 
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大 信和 号 多 数 是 由 第 7 段 来 表示 的 (从 表 上 看 出 ) 3 个 指数 位 用 来 表示 第 0 段 到 第 了 跨 ，4 个 
尾数 位 用 于 表示 后 4 个 有 效 位 ， 还 有 一 位 是 符号 位 。 

16 比特 的 输 人 数据 是 由 线性 数据 变换 成 8 比特 H 律 数据 ( 模拟 传输 ), 然后 再 从 上 律 转换 成 16 
比特 的 线性 数据 ( 模拟 接收 )， 再 输出 到 编 解码 器 。 


9.9 ”语音 检测 及 逆 回 放 


本 谋 题 用 话 简 检测 语音 信号 ， 然 后 再 从 相反 方向 回放 。 课 感 使 用 了 两 个 缓冲 区 : 输 人 缓冲 区 
可 保存 不 断 更 新 的 80 000 个 抽样 ( 10 秒 的 数据 量 )， 输 出 缓冲 区 用 来 反 向 回放 输入 的 语音 信号 。 
谋 题 能 检测 信号 的 电 平 并 跟踪 包 络 的 变化 ， 从 而 决定 是 否 有 语音 信号。 

当 语音 信号 出 现 ， 然 后 又 闭关 消失 有 时， 信号 电 平 检测 其 发 出 命令 ， 启 动 信号 回放 过 程 ， 这 时 
存储 的 数据 由 输入 缓冲 区 传输 到 回放 的 输出 缓冲 区 。 当 到 达 整 个 检测 到 的 信号 的 结尾 时 ， 停 赴 回 
放 过 程 。 

信和 号 电 平 检测 方案 包括 整流 和 滤波 ( 用 简单 一 阶 TIR. 滤波 器 实现 )。 当 信 号 到 达 较 高 的 门限 电 
平时 ， 显 示 融 就 会 有 相应 的 显示 ; 当 信 和 号 下 降 到 较 低 的 门限 时 ， 就 可 以 计算 语音 开始 和 结束 的 时 
闻 差 。 如 果 该 时 间 差 小 于 指定 的 时 间 间 隔 ， 程 序 就 继续 进 人 无 信号 状态 (假设 只 有 噪声 )， 否 则 ， 
如 果 该 时 间 差 比 指定 的 时 间 间 生长 ， 这 时 就 会 激活 信号 检测 模式 。 


9.10 ”其 他 课题 
下 面 介绍 一 些 其 他 课题 ， 它们 使 用 CIC3x 和 CaxCS 程序 或 指令 实时 实现 了 课题 


9.10.1 声波 方向 跟踪 器 


文献 二 讨论 了 声波 方向 跟踪 器 ， 并 用 C/C3x 程序 指令 实现 了 它 。 使 用 两 个 话 简 来 捕获 信号 ， 
根据 信号 到 达 两 个 话 简 的 时 延 ， 可 确定 声 源 位 置 的 相对 角度 。 SSA NSM, Oy 
有 如 图 9.6 所 示 平面 波 前 ， 这 样 就 可 以 把 传感器 ( 许多 话 简 可 作为 声学 传感器 ) 等 间隔 地 排 成 一 
行 ， 确 定 信号 辐射 的 角度 。 如 果 一 个 话 简 比 另 一 个 更 靠近 信号 源 ， 较 远 的 话 简 接 收 到 的 信号 就 有 
较 大 的 时 间 延 退 ， 该 时 间 延 与 信号 源 位 秆 的 角度 以 及 话 简 和 信号 源 之 问 的 相对 距 商 相对 应 。 角度 
c = arcsin(a/b) ， 这 里 距离 4 是 声速 和 延迟 时 间 的 乘积 ( 相位 应 率 ) : 





图 9.6 使 用 两 个 话 简 的 信号 接收 
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图 9.7 所 示 的 框图 是 声音 信号 的 跟踪 器 。 通 过 它 可 得 到 两 个 128 点 的 数组 数据 ， 计 算 第 一 个 
信号 与 第 二 个 信号 的 互相 关 , 再 将 互相 关 的 结果 数据 分 解 成 两 部 分 ， 每 次 变换 使 用 128 点 的 FFT, 
最 后 的 相位 是 两 个 信号 的 相位 差 。 





' 
| y = [0, 1, 2 ,125, 126, 127] 











图 9.7 HES Rea 


9.10.2 多 速率 滤波 器 


使 用 多 速率 处 理 方法 ， 可 用 较 少 的 系数 实现 滤波 器 ， 而 使 用 等 效 的 单一 速率 方法 却 不 然 。 文 
献 P"44 讨 论 并 利用 C3x/C4x 和 C2x/CSx 兼容 指令 实现 了 多 速率 涉 波 器 。 多 速率 滤波 器 潜在 的 应 用 
包括 图 形 均衡 器 、 受 控 曲 声 源 、 背 景 噪声 合成 器 。 多 速率 滤波 处 理 使 用 多 个 抽样 速率 实现 需要 的 
处 理 操作 。 两 个 基本 的 处 理 是 抽取 和 插值 ， 前 者 是 减 小 抽样 速率 ， 后 者 是 提高 抽样 速率 全。 多 
速率 抽取 器 能 减 小 滤波 器 的 运算 量 。 抽 样 速率 增加 天 售 可 通过 在 多 和 区 ,之 间 须 序 插 和 人 久 -1 个 
0 来 实现 ， 多 级 抽取 和 插值 一 般 具 有 较 高 的 效率 。 | 

二 进 制 随机 信号 输入 到 一 组 滤波 器 ; 形成 输出 信号 的 功率 谱 , 图 9.8 给 出 了 10 种 带宽 的 多 束 
率 滤波 器 功能 原理 框图 。 关 于 该 滤波 器 已 经 进行 了 讨论 ， 并 利用 Cx A C2xw/C5x 指令 [94 实现 
TE, 其 频率 范围 分 为 10 倍 频 程 频带 ， 每 个 频带 的 1/5 信 频 程 是 可 调节 的 。 


9.10.3 神经 网 络 在 信号 识别 中 的 应 用 


将 信号 经 过 FFT 处 理 的 结果 输入 到 神经 网 络 ， 经 过 调 练 的 神经 网 络 ， 该 网 络 是 利用 C 语言 
实现 的 ， 并 采用 后 向 传播 学 习 算法 “4 识别 输 人 信号 。 为 了 说 明 该 算法 ， 图 9.9 给 出 了 7 节点 的 
三 层 神 经 网 络 模 型 。 现在 有 许多 不 同 的 神经 网 络 训 练 算 法 , 其 中 后 向 传播 算法 已 经 得 到 广泛 的 应 
H. 假设 输入 一 组 信号 ， 训 练 网 络 给 出 要 求 的 响应 。 如 果 神 经 网 络 给 出 错误 的 输出 时 ， 网络 就 需 
要 调整 参数 ( 权 系数 )， 从 而 使 网 络 能 够 得 到 修正 ， 减 少 错误 的 发 生 。 在 修正 调整 过 程 中 ， 从 输 
出 节点 开始 ， 向 后 传播 到 输入 节点 。 


9.10.4 PID 控制 器 


在 文献 "所 中 ,使 用 了 比例 、 积 分 和 微分 ( PID ) 控制 算法 ,实现 了 自 适应 和 非 自 适应 控制 
器 。 
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图 9.9 了 个 节点 的 三 层 神经 网 络 
9.10.5 ”用 于 快速 获得 数据 的 四 遂 道 复 用 器 


为 了 完成 该 课题 ， 用 C 程序 设计 和 搭建 了 一 个 四 通道 自用 器 模 块 四 ,课题 使 用 一 个 8 位 闪烁 
(Flash) ADC, 一 个 FIFO, 一 个 MUX, — dbi (2 MHz 或 者 20 MHz )。 使 用 4 个 通道 中 的 一 
个 通道 对 一 路 输入 信和 号 进 行 采集 ， 输 入 信号 的 FET 实时 县 示 在 PC 显示 器 上 。 


9.10.6 ”视频 行 速率 分 析 


该 课题 在 文献 9 中 进行 了 讨论 ， 并 用 CiC3x 实现 了 行 速率 视频 信号 的 分 析 。 交 互 式 算法 通 
常用 于 图 像 处 理 中 的 滤波 、 平 均 和 边缘 锐 化 ，、 这 些 算法 是 用 CC 语言 编写 的 ， 实 更 了 图 像 的 分 析 。 
用 CCD 摄像 机 作为 视频 倩 号 源 ， 输 人 给 该 课题 设计 的 一 个 电路 模块 ， 该 模块 包括 触发 器 .逻辑 
门 和 时 钟 。PC 显示 器 上 显示 了 使 用 500 kHz 或 3 MHz fj IIR 低 通 滤波 器 以 及 边缘 锐 化 算法 对 视 
频 行 信号 的 不 合影 响 。 
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附录 A TMS320C6x 指令 集 


Al 定点 和 浮 点 操作 指令 


表 A.1 列 出 了 Cox 处 理 器 的 指令 , 表 中 的 这 些 指令 是 按照 它们 所 使 用 的 功能 单元 来 进行 分 类 
的 ， 这 些 指令 可 用 于 C6x ME AEE BSE o 


RAS 定点 和 学 点 操作 指令 
. 1, Unit .M Unt . -S Unit s -© Unit 


ABS MPY ADD ADD 
ADD MPYH ADDK ADDAB 
ADDU MPYHL ADD2 ADDAH 
AND MPYHLU AND ADDAW 
CMPEQ MPYHSLU B disp LDB 
CMPGT MPYHSU B IRP* LDBU 
CMPGTU MPYHU B NRP* LDH 
CMPLT MPYHULS B reg LDHU 
CMPLTU MPYHUS CLR LDW 
LMED MPYLH EXT LDE (18-bit offset) ** 
My MPYLHU EXTU LDBU (15-bit offset" * 
NEG MPYLSHU MV LDH (15-bit offset) ** 
NORM MPYLUHS MVC* LDHU (15-bit offset)"* 
NOT MPYSU MVE LOW (15-bit offsat) ** 
OR MPYU MVKH MV 
SADD MPYUS MyELH STR 
SAT SMPY NEG STH 
SSUB SMPYH NOT STW 
SUB SMPYHL OR STB (15-bit offset)** 
SUBU SMPYLH SET STE (15-bit offsat)** 
SUBC SHL Stw (15-bit offset)** 
XOR SHR SUB 
ZERO SHRU SUBAB 

SSHL SUBAH 

SUB SUBAW 

SUBU ZERO 

SUB2 

XOR 

ZERO 


*, 只 适用 于 S2; **. 只 适用 于 D2. TAMAS A, 
A2 浮 点 操作 指令 


表 A.2 列 出 了 C67x 浮 点 处 理 器 的 附加 指令 ,这些 指令 执行 浮 点 类 型 的 操作 。 同 样 ， 这 里 也 
是 按照 它们 所 使 用 的 功能 单元 来 进行 分 类 的 。 
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A2 学 点 操作 指令 





.L Unit .M Unit .8 Unit .D Unit 
ADDDP |^ MPYDP 0 ABSDP + -| ADDAD 
ADDSP MPYI |^  ABSSP  LDDW 
DPINT MPYID CMPEQDP 

DPSP MPYSP CMPEOSP 

DPTRUNC . CMPGTDP 

INTDP CMPGTSP 

INTDPU CMPLTDP 

INTSP CMPLTSP 

INTSPU RCPDP 

SPINT RCPSP 

SPTRUNC RSQRDP 

SUBDP | RSORSP 

SUBSP SPDP 


TIA HFS 
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附录 了 “循环 寻 址 寄存 器 和 中 断 寄 存 器 


Pa B.1 到 图 B.8 介绍 了 C6x 处 理 器 中 的 几 个 特殊 寄存 器 。 


1. 


uU oe -d CN CA RR ot b 


图 B.1 表示 的 是 寻 址 模式 寄存 器 ( AMR )， 用 于 循环 寻 址 模式 ， 它 用 于 选择 8 个 寄存 器 指 
针 (Ad4 至 A7，B4 至 87) 中 的 一 个 以 及 两 组 用 于 循环 缓冲 区 的 存储 区 块 (BK0, BKI ), 


. 图 B.2 表示 的 是 控制 状态 寄存 器 ( CSR )， 其 中 位 0 是 全 局 中 断 使 能 (GE) 位。 
. BL B3 表示 的 基 中 断 启用 寄存 器 (IER )。 

. 图 B.4 表示 的 是 中 断 标志 寄存 器 (JFR )。 

. BS 表示 的 是 中 断 设置 寄 存 器 〈ISR )。 

. 图 B.6 表示 的 是 中 断 清除 寄存 器 CICR )。 

. 图 B.7 表示 的 是 中 断 服 务 表 指针 【ISTP )。 

. 图 B.8 表示 的 是 串 行 口 控 制 寄存 听 (SPCR )。 


7.2 节 讨 论 了 AMR 寄存 器 3.14 节 讨 论 了 中 断 寄存 器 。 
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图 B.2 控制 状态 寄存 器 (CSR ) (由 TARER ) 
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图 B.3 中 断 局 用 害 存 器 (IER ) (出 TI 公司 提供 ) 
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图 B.7 “中断 服务 表 指 针 《isTP ) CO 二 公司 提供 ) 
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图 B.8 品行 口 控制 寄存 器 (SPCR) (H TARIH) 
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附录 C ”定点 运算 需要 考虑 的 问题 


C6711 是 -- 款 浮 点 处 理 器 , 可 以 进行 整 型 和 浮 点 运算 。C6711 和 AD535 编 解码 器 者 支持 2 的 
补 码 运算 ， 因 此 ,这 里 有 必要 回顾 一 下 定点 运算 的 一 些 概念 。 

在 定点 处 理 器 中 , 数 是 用 整数 表示 的 ; 而 在 浮 点 处 理 器 中 , 定点 和 泽 点 运算 都 是 可 以 外 理 的 。 
和 使 用 定点 处 理 器 相 比 ， 浮 点 处 理 器 C6711 可 以 表示 的 数 的 范围 更 大 。 

如 果 用 2 的 补 码 表 示 ， 六 位 数 的 动态 范围 介 于 -2 至 2*1 ~ 1 之 闻 ， 也 就 是 说 ， 对 于 16 位 系 
统 ， 其 表示 范围 介 于 -32 768 至 32 767 之 间 。 如 果 拒 动态 范 肝 归 一 化 到 -1 和 1 之 间 , 这 样 就 要 把 
这 个 范围 分 成 2 个 段 , BBA ADIN, 数据 表示 的 范围 就 从 -1 至 1 - 29。 对 于 4 位 系统 ， 
则 分 为 16 段 ， 每 段 的 大 小 是 18, 表示 的 范围 从 -1 至 7/8。 


CA 二 进 制 和 2 的 补 码 表示 


为 了 更 便于 说 明 问题 ， 我 们 不 妨 用 4 位 字 长 的 系统 作为 例子 ， 而 不 是 使 用 32 位 字 长 。 如 
3€ C.1 所 示 ，4 位 字 可 以 表示 0 至 15 之 间 的 无 符 导数 。 

4 位 无 符号 数 可 以 表示 模 为 16 的 系统 ， 如 果 把 最 大 数 (150 加 上 1， 访 运算 将 绕 回 来 ， 从 而 
给 出 答案 0。 腿 位 系统 和 号 码 锁 的 数字 转盘 具有 同样 的 模 性 质 ， 图 .1 给 出 了 一 个 数字 转盘 ， 
数字 0 到 15 围绕 在 转盘 的 外 面 。 在 该 范围 内 ， 对 任意 两 个 数字 x Fly, 按照 如 下 操作 ， 就 可 求 出 
两 个 数字 的 和 


1 在 转盘 上 找到 第 一 个 数字 x; | 
2. WEBER y TRALEE, SAB) T RSE HOE 


| 表 C.1 无 符号 二 进 制 数 
二 进 抽 十 进 制 


0000 l 00. 
. 0001 1 
0010 v 2 

3 


0011 


1110 14 
|^ 1011- 15 


例如 : 考虑 加 法 (5+7) mod 16， 得 到 结果 是 12。 计 算 过 程 是 这 样 的 ， 在 转盘 上 找到 5， 然 
后 沿 顺 时 针 方向 前 进 7 个 单位 段 ， 就 得 到 了 结果 12。 举 另外 一 个 例子 : (124+ 10) mod 16=6, 在 
数字 转盘 上 找到 12, 然后 顺 时 针 方向 前 进 10 单 位 段 ， 经 过 0， 得 到 结果 6。 
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图 C.1 无 符 号 整 教 的 数字 转盘 


负数 在 数字 转盘 上 需要 对 转盘 上 的 数 有 不 同 的 解释 ， 如 果 我 们 穿 过 数字 8 画 一 条 线 并 将 数字 
转盘 分 成 两 半 ， 右 半 部 分 代表 正 数 ， 左 半 部 分 代表 负数 ， 如 图 C2 所 示 ， 这 就 表示 了 一 个 2 的 补 
玛 系统 。 负 数 是 正 数 的 2 的 补 码 ,反之 亦 然 。 0 





1001 
-7 


0111 
7 


1000 
-8 
图 C2 FARES ERS SO | 


一 个 二 进 制 整数 的 2 的 补 码 表示 为 : 


B =b, bib 
它 等 于 十 进 制 整数 : 
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I(B)--b,, x23 + +--+, x2! +b x2? 
其 中 , bo. by bo 是 二 进 制 数 。 FF SAAR, 其 他 所 有 位 的 权 值 都 为 正 。 例如 : FER- 
1110 = -1x23+1x22+1x2L+0x20=-8+4+2+0= -2 


使 用 上 面 的 图 形 方 法 来 计算 6+ (2) mod 16 = 4,， 在 数字 转盘 上 找到 6, 然后 按 顺 时 针 方 向 转 
Bb (11100 个 单位 段 ， 就 得 到 结果 为 4。 
同样 ,两 个 数 的 二 进 制 加 法 如 下 : 


0110 
1110 


10100 
^C 
可 见 ， 在 有 限 字 长 寄存 器 算术 运算 条 件 下 ， 最 高 有 效 位 的 进位 就 被 略 去 ， 进 位 对 应 着 绕 过 数字 转 
盘 的 零点 。 对 于 “位 的 数 ， 假 设计 算 结果 在 可 表示 的 范围 -2 和 到 2 - 1 之 间 ， 如 果 忽 路 最 高 有 效 
位 的 进位 ， 就 会 得 到 两 个 数 相 加 的 正确 结果 。 对 于 前 面 4 位 数字 转盘 的 例子 ， 结 果 应 该 在 -8 至 7 
之 间 。 当 在 4 位 系统 中 ， 如 果 将 -7 和 -8 进行 相 加 ， 我 们 就 会 得 到 结果 为 +1， 而 不 是 正确 的 结果 
-15， 因 为 -15 超出 了 表示 的 范围 。 当 两 个 符号 相同 的 数 相 加 ， 结果 的 符号 位 和 原来 的 数 相反 时 ， 
出 现 这 种 情况 时 是 由 于 产生 了 溢出 。2 的 补 码 减法 等 效 于 被 减 数 的 2 的 补 码 再 加 上 另 一 个 数 。 


C. 小 数 的 定点 表示 


前 面 刚刚 讨论 过 小 数 的 定点 表示 ， 也 可 以 使 用 定点 表示 小 数 , 小 数 的 定点 表示 范围 在 10.99… 
到 -1 之 向 。 为 了 用 ”位 表示 人 小数， 小 数 点 必须 左 移 一 1 位 ， 这 样 就 利 下 一 个 符号 位 和 严 ~ 1 个 小 
数位 ， 其 表示 式 : 


F(B)- A x2? +b x2 +h x2? "S x2 


公式 把 二 进 制 的 小 数 转换 成 十 进 制 的 小 数 。 和 整数 的 定点 表示 相似 ， 符 号 位 的 权重 是 _1， 其 他 位 
的 权重 是 1/2 WERKE. E C.3 给 出 了 采用 数字 转盘 表示 2 的 补 码 的 4 位 小 数 。 小 数 的 数值 可 用 图 
C2 的 2 的 补 码 整数 除 以 2 得 到 ,因为 4 位 系统 的 位 数 较 少 ,所 以 它 能 表示 的 范围 也 比较 小 ， 从 -1 至 
0.875。 对 16 位 的 字 、 有 符号 整数 的 表示 范围 从 -32 768 至 +32 767， 为 了 得 到 小 数 的 表示 范围 用 29 
或 32 768 去 除 这 两 个 有 符号 数 ， 就 可 以 得 出 表示 范围 是 从 -1 至 0999 969 《通常 到 1 )。 


C.3 乘法 


如 果 将 两 个 n TORR, AK 的 想法 是 运算 结果 是 2n 位 的 操作 数 ， 尽 管 这 对 无 符号 数 是 
正确 的 ， 但 对 有 符号 数 就 不 正确 了 。 如 前 所 述 ， 有 符号 数 需要 符号 位 ， 符号 位 的 权重 是 -2 1， 其 
余 的 位 是 正 的 ， 权 重 为 2 的 宕 指数 。 为 了 得 到 两 个 ”位 数 相 乘 的 结果 禹 要 的 位 数 ， 我 们 把 两 个 最 
大 的 位 数 相 乘 : 


P =(~2"'\(-27') = 27 
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1.001 0.111 
-0.875 1.000 0.875 


HC3 Senn CERE 


这 个 数 是 正 数 ， 可 以 用 2n — 1 位 表示 。 如 果 从 0 比特 位 开始 计算 ， BAS Re | 
2n - 2 比特 位 。 因 为 这 个 数 是 正 数 ， 记 以 它 的 符号 位 不 会 显示 出 来 ; 而 当 它 为 负数 时 ， 符 号 位 就 
会 显示 出 来 (2 的 宕 指数 )。 这 是 一 个 例外 的 情况 ， 在 用 小 数 表示 时 ， 这 种 情况 将 被 处 理 为 溢出 。 
因为 小 数 表 示 要 求 操作 数 和 结果 有 隔 样 的 范围 ， BOK TEP 1 有 小 于 +1。 而 CD) x CD 两 个 数 相 
乘 得 到 +1， 这 个 数 不 能 用 小 数 来 表示 。 

下 面 考虑 仅 次 于 上 面 两 个 数 相 乘 的 结果 : 


P= (-271)(-271 m 1) 一 222-2 —-2*4 
式 中 因为 是 第 一 个 数 减 去 第 二 个 数 ， 所 以 要 从 0 位 开始 计算 ,结果 将 会 占用 2n - 3 个 比特 位 ， 
这 样 ， 就 可 以 用 2n - 2 位 表示 。 除 例外 情况 ， 第 2r - 2 比特 位 可 以 作为 符号 位 使 用 ， 因 此 ， 为 了 
支持 (nx 如 位 有 符号 数 乘法 ， 需 要 2n - 1 位。 
为 了 冰 明 前 述 的 等 式 ， 考 虑 下 面 对 于 4 位 的 情况 ， 
P =(-2?\-23 +1)=2° -2? 
SO kA 6 个 比特 位 。 因为 第 二 个 数 是 负 值 , 所 以 两 个 数 的 和 占据 的 位 只 能 比比 特 位 6 少 的 位 ， 
或 者 如 下 表示 ， s 
25 — 2° = 64-8 = 56 = 00111000 | 
这 样 ,第 6 个 比特 位 置 就 可 以 作为 符 导 位 , 用 8 位 等 价 的 数 来 表示 时 就 有 两 个 符号 位 ( 位 6 和 位 7 小 
Cox 支持 有 符号 数 和 无 符号 数 乘法 ， 因 此 可 用 2n 位 来 存放 乘积 。 


考虑 两 个 4 位 小 数 的 乘法 ,每 个 数 有 3 个 小 数位 和 一 个 符号 位 ， 结 果 用 -个 8 位 数 来 表示 ， 
第 一 个 数 是 -0.5， 第 二 个 数 是 0.75， 按 照 下 面 的 过 程 进行 相 乘 ， 
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0.50 = 1.100 
x0.75 2 0.110 





— luno 
111000 


111.101000 
C 
2-25 29 -2!42?--0.75 
SOP, gexeBcpm FANEBDIACRSTUSU Hu. fanum BIRR Lit, wee Ze ETT 
sus HR. PRDRAHRAL. ATR OE, BIER Re, MOR 
时 针 方 向 查看 图 C.2 的 数字 转盘 ， 写 出 5 位 、6 位 、7 位 …… 负 数 的 扩展 表示 形式 。 注 意 , 通过 对 
现 有 4 位 进行 符号 扩展 得 到 正确 的 结果 ， 因此， 符号 扩展 可 得 到 正确 的 扩展 位 数 。 尽 管 将 忽 赂 进 
位 输出 ,但 是，111.101000 (9 位 字 )，11.101000 (8 位 字 ) 和 1.101000 (7 位 字 ) 都 表示 同样 的 
-0.375, DHE, WF PRR 4 位 系统 中 可 以 用 2n ~ 1 或 7 位 来 表示 。 
当 两 个 16 位 数 相 乘 产生 32 位 结果 时 ， 其 实 只 要 31 位 就 可 以 了 ， 因 此 ， 位 31 是 位 30 的 符 
号 扩展 位 ， 扩 展位 通常 称 为 符号 位 。 
考虑 下 面 的 例子 : 把 (0101): 和 (1110)> 相 乘 ,等 价 于 十 进 制 中 的 5 3EUL-2, 得 到 的 结果 是 -10， 
它 超出 了 4 位 系统 的 动态 范围 | -8, 7 l; 当 使 用 3 位 小 数位 格式 ， 这 相当 于 0.625 3812-025, 得 
到 的 结果 是 -0.156 25, 结果 在 小 数 的 表示 范围 内 。 
当 两 个 15 位 小 数位 格式 的 数 ( 每 个 数 有 一 个 符号 位 ) 相 乘 时 ,结果 是 30 位 小 数位 格式 的 数 ， 
有 一 个 多 余 的 符号 位 ， 最 高 位 是 多 余 的 符号 位 ， 可 以 右 移 15 位 来 保留 最 高 一 些 有 效 位 和 两 个 符 
号 位 中 的 一 个 , 通过 右 移 15 位 CERUA25 ) 可 以 把 结果 存储 在 一 个 16 位 的 系统 中 ， 这 样 就 丢弃 了 
15 个 最 低位 ， 因 此 会 损失 一 些 精度 。 保留 最 高 15 位 可 以 保持 高 的 精度 。 对 于 32 位 的 系统 ， 左 移 
一 位 就 可 以 去 掉包 余 的 符号 位 。 

”注意 到 当 两 个 15 位 小 数位 格式 的 数 相 乘 ， 表 示 的 范围 是 -1 到 1， 结果 保持 在 同样 的 范围 内 ; 
但 两 个 15 位 小 数位 的 数 相 加 ， 结 果 就 可 能 超过 此 范围 ， 从 而 引起 溢出 ， 因 此 要 使 用 定 标 方法 纠 
正 这 种 溢出 现象 。 . 

因为 AD535 是 16 位 系统 ，32 位 的 结果 最 终 必须 截 短 或 者 四 合 五 人 ,最 高 一 些 有 效 位 、 符 号 
位 以 及 它 的 扩展 位 存储 在 Cox. 累加 寄存 器 的 高 位 部 分 , 累加 寄存 器 的 高 位 部 分 左 牧 去 掉包 余 的 符 
号 位 ， 当 数据 传送 到 16 位 存储 单元 时 ， 就 增加 一 个 附加 分 辨 率 比 特 位 。 


参考 文献 
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附录 D MATLAB 支持 工具 f 


附录 D RET MATLABIL2IPIBJLT- X SET-R: 


1. 滤波 器 设计 工具 SPTOOL ， 它 使 用 图 形 用 户 接口 (GUI ) 进行 FIR 和 IIR 滤波 器 的 设计 。 
RTSPTOOL # SPTOOL 工具 的 扩展 。 

2. 使 用 学 生 版 MATLAB 中 的 函数 进行 FR 和 TIR 滤波 器 设计 。 

3， 双 线性 变换 。 

4. FFT 和 IFFT. 


D.1 Ri MATLAB GUI 中 的 SPTOOL 设计 FIR 滤波 器 


MATLAB 提供 了 图 形 用 户 接 口 ( GUI ) 的 滤波 器 设 计 工 具 SPTOOL, 可 用 于 设计 FIR (或 JR ) 
滤波 器 。 


8KD.1 Fl MATLAB GUI 中 的 滤波 器 设计 工具 SPTOOL 设计 FIR CE ' 
1. 4 MATLAB 中 键入 : 
>>sptool 


It A. MATLAB 图 形 用 户 接口 滤波 器 设计 工具 SPTOOL, 用 它 设计 FIR 和 OR 滤波 器 。 

2. 在 启动 窗口 startup.spt 路 ， 选 择 一 个 新 的 设计 并 用 图 D.1 显示 的 滤波 器 特性 ， 设 计 一 个 中 
心 频率 在 2700 Hz 的 FIR 带 阻 滤波 项 。 该 滤波 器 有 N= 89 系数 ( MATLAB 显示 的 阶 数 是 
N-1). 使 用 凯 塞 ( Kaiser) BAG, TEDI 4.1 中 ， 对 泪 波 器 的 实时 实现 进行 了 测试 。 

3. 测试 结束 后 ， 再 次 打开 startup 窗口 ， 选 择 菜单 Select—EditName, EAE (输入 新 的 
文件 名 ) 修改 为 bs2700。 

4. 选择 菜单 File 一 Export 一 Expor to Workspace， 把 设计 的 滤波 器 bs2700 的 设计 参数 导出 到 
MATLAB 工作 窗口 。 

5. 进入 MATLAB 工作 徐 口 ， 键 入 下 面 商 个 命令 : 

>>bs2700.ti.num; 

»»round(bs2700.tf.num*2^15) 

得 到 传输 函数 中 分 子 的 系数 , 并 用 2^ 进行 定 标 ,这 时 工作 窗口 显示 FIR 带 阻 滤波 器 的 系 
AF : 


-14 23 -9..23 -14 
如 图 D.2 所 示 ， 这 些 系数 保存 在 文件 bs2700.cof 中 ， 例 4.1 使 用 了 这 些 系数 。 
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图 D.1 MATLAB 滤波 器 设计 工具 SPTOOL 的 窗口 ， 显 
示 中 心 频率 为 2700 Hz 的 FIR 带 阻 滤波 器 的 特性 


//B82700.cof FIR bandstop coefficients designed with MATLAB 
#define N 89 //number of coefficients 


short h(N] 2(-14,23, -9, -6,0,8,16, -58,50,44,-147,119,67,-245,200,72, 
-312,257,53,-299,239,20,-165,88,0,105,-236,33,490,-740,158,932,-1380, 
392,1348, -2070, 724,1650, -2690,1104,1776,-3122,1458,1704,29491,1704, 
1458, -3122, 1776, 1104, -2690,1650, 724, -2070, 1348, 392, -1380 ,932, 158, -740, 
490,33,-236,105,0,88,-165,20,239,-299,53,257, -312,72,200,-245,67,113, 
-147,44,50,-58,16,8,0,-6,-9,23,-14); 


D2 用 MATLAB 的 滤波 器 设计 工具 SPTOOL 设计 ， 中 心 频 
率 为 2700 Hz 的 FIR 带 阻 滤波 器 的 系数 文件 (bs2700.cof ) 


实时 SPTOOL (RTSPTOOL ) 

实时 SPTOOL ( RTSPTOOL ) 为 DSK[3-5] 提 供 了 一 个 直接 的 接口 ， 通过 该 接口 可 以 在 DSK 
上 实时 地 设计 和 实现 ( 在 MATLAB 环境 下 ) 滤波 器 。RTSPTOOL 的 窗口 和 SPTOOL 的 窗口 很 相 
像 ， 只 是 附加 了 一 个 用 在 DSK 上 实时 运行 滤波 器 设计 的 工具 条 。 按 下 适当 的 工具 条 ， 就 可 得 到 
想 要 的 滤波 器 。 系 数 经 过 定 标 后 ， 存 到 通用 FIR 程序 包含 的 文件 中 。 通过 修改 MATLAB 文件 
filtdes.m. 得 到 从 MATLAB 到 DSK 的 接口 ,一 个 MATLAB 的 .m 函数 访问 CCS 程序 代码 生成 工具 ， 
在 DSK 中 编译 /汇编 、 连 接 、 装 载 /运行 可 执行 文件 ( 装载 /运行 使 用 dsk6xldr filename.out 文件 )。 


D2 Ħ MATLAB GUI 中 的 SPTOOL 设计 IIR 滤波 器 


在 D.1 节 中 ,介绍 了 利用 MATLAB 的 GUI 滤波 器 设计 工具 SPTOOL 设计 FIR 滤波 器 的 过 程 ， 
同样 的 一 些 过 程 也 可 以 用 于 IR 滤波 器 的 设计 。 
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例 D.2 FA MATLAB 的 GUI 滤波 器 设计 工具 SPTOOL 设计 IIR 滤波 器 

图 D.3 显示 了 用 MATLAB 的 滤波 器 设计 工具 SPTOOL 设计 出 的 十 阶 TIR 带 阻 滤波 器 的 特性 ， 
其 中 心 频率 是 1750 Hz. MATLAB 显示 的 阶 数 是 5， 表示 的 是 二 阶 单元 的 数目 。 把 它 保 存 到 文件 
bs1750 ( 见 例 D.1) 中 。 像 前 面 的 FIR 滤波 器 设计 一 样 ， 把 滤波 器 的 系数 导出 到 工作 窗口 ,在 
MATLAB 的 工作 窗口 键入 命令 : 

>>[z,p,k] = tf2zp(bs1750.tf.num, bs1750.tf.den); 


>>sec_ord_sec = zp2sos(z,p,k); 
>>sec_ord_sec round(sec ord sec*2^15) 





图 D.3 MATLAB 的 滤波 器 设计 工具 SPTOOL 窗口 显示 
的 中 心 频率 为 1750 Hz 的 TIR 带 阻 滤波 器 的 特性 


第 一 条 命令 分 别 计算 出 分 子 和 分 母 的 根 ( 零点 和 极点 )， 并 把 ( 定 标 后 的 ) 结果 转换 成 以 二 
阶 单元 实现 的 格式 。 分 子 分 母系 数 如 下 : 
27940 -10910 27940 32768 -11417 25710 


32768 -14239 32768 32768 -15258 32584 


这 30 个 系数 表示 分 子 的 系数 a, a , a; 和 分 母 的 参数 bo , bi, bs , 它们 表示 每 个 二 阶 单元 的 
6 个 系数 ，b。 归 一 化 为 1, 并 且 用 25 = 32 768 定 标 , 这些 系数 保存 在 文件 bs1750.cof H. 图 D.4 
中 也 列 出 了 这 些 系数 ， 例 5.1 也 使 用 了 这 些 系数 。 图 D.4 显示 了 25 个 系数 ( 而 不 是 30 个 系数 ) 
因为 系数 bo 总 是 归 一 化 为 1 ,程序 中 并 没有 使 用 -如 在 FIR 滤波 器 设计 中 的 一 样 , 按 下 RTSPTOOL 
中 的 一 个 按钮 ， 实 时 实现 该 IIR 带 阻 滤波 器 4 
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//pal750.cof IIR bandstop coefficient file, centered at 1,750 Hz 


#define stages 5 //number of 2nd-order stages 
int a[stages][3]- { //numerator coefficients 
(27940, -10910, 27940}, //al0, all, al? for lst stage 
(32768, -11841, 32768}, /fa20, a21, a22 for 2nd stage 
(32768, -13744, 32758], /fa30, a31, aà2 for 3rd stage 
(32768, -11338, 32768], //a40, a41, a42 for áth stage 


132768, -14239, 32768} 3}; 


* 


int bletagesl [2]= 00€  //*denominator coefficients 


(-11417, 25710}, | J4fbli, bi2 for Ist stage 
{-9294, 31581), |. ^ 7  .4/b21, b22 for. 2nd stage 
{-15860, 31505), //b31, b32 for 3rd stage 
(-10221, 32581}, //b4l, b42 for 4th stage 
(-1525B, 32584) li //b51, b52 for Sth stage 





图 D.4 ”中心 频率 为 1750 Hz 的 HR 带 阻 滤波 器 系数 文件 , 该 系数 文件 是 
FA MATALAB 滤波 器 设计 工具 SPTOOL 求 出 的 《bsl750.cof ) 


D3 用 学 生 版 MATLAB 设计 FIR 滤波 器 


可 以 用 学 生 版 的 MATLAB 软件 包 进 行 滤波 器 的 设计 外 ,同时 也 可 以 参见 D.1 Y, 用 MATLAB 
的 GUI 滤波 器 设计 工具 SPTOOL 进行 FIR 滤波 器 的 设计 。 


例 D.3 用 学 生 版 MATLAB 进行 速 波 器 设计 
图 D.5 给 出 了 MATLAB UT mat33.m, 该 程序 用 于 设计 一 个 33 个 系数 的 FIR 带 通 滤波 器 。 
函数 remez 使 用 基于 Remez 交换 算法 和 Chebyshev 还 近 理论 的 Parks-McClellan 算法 ,设计 的 滤波 


器 中 心 频率 为 1 Hz， 抽样 频率 为 10 kHz, 频率 v 表示 归 一 化 频率 变量 , ELA v= fF ,其 中 ， 
Fwy 为 奈 率 斯 特 频 率 。 带 通 滤波 器 由 以 下 三 个 频带 表示 : 


1， 第 一 个 频带 ( 阻 带 } 的 归 一 化 频率 为 0 至 0.1 {0 Hz 到 500 Hz )， 对 应 的 幅度 响应 为 0。 

2. 第 一 个 频带 ( 通 带 ) 的 归 一 化 频率 为 0.15 至 0.25 (750 Hz 到 1250 Hz), 对 应 的 幅度 响应 为 1。 

3. 第 三 个 频带 ( 阻 带 ) 的 归 一 化 频率 为 0.3 ZEXESENIHRERDRE 1 (1500 Hz 至 5000 Hz), XP 
的 幅度 响应 为 0。 


XMat33.m MATLAB program for FIR Bandpass with 33 coefficients Fs=10 kHz 


nus [0 0.1 0.15 0.25 0.3 1]: normalized frequencies 


mag= [00 1 1 0 0]; *magnitude at normalized frequencies 
c=remez (32,nu,mag); *invoke remez algorithm for 33 coeff 
bp33-c'; % coeff values transposed 

save matpb33.cof bp33 -ascii; tsave in ASCII file with coefficients 

[h,w] =freqz {c,1,256); $frequency response with 256 points 


plotí5000*nu,mag,w/pi,abs(h)) *plot ideal magnitude response 








EDS 用 于 HTR 滤波 器 设计 的 MATLAB 程序 { mat33.m ) 
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TE MATLAB 中 运行 该 程序 , 检验 设计 的 理想 滤波 器 的 幅度 响应 ,图 D.6 是 在 MATLAB 中 夯 
出 的 特性 图 。 注 意 频率 750 Hz 和 1250 Hz 表示 通 带 频率 ， 分 别 对 应 归 一 化 频率 0.15 81025, 38 
应 的 幅度 响应 为 1。 频率 500 Hz 和 1500 Hz 表示 阻 带 频率 ， 分 别 对 应 归 一 化 频率 0.1 和 0.3, 相应 
的 幅度 响应 为 0。 最 后 的 归 一 化 频率 1 对 应 奈 奉 斯 特 频率 5000 Hz ， 相 应 的 幅度 响应 为 0， 程序 产 
^E 33 个 一 组 的 系数 ， 并 以 ASCI 格式 保存 在 系数 文件 matbp33.cof 中 。 


1.2 

1 
0.8 
0.6 
0.4 


0.2 


% 500 1000 1500 2000 2500 3000 3600 4000 4500 5000 
图 D6 MATLAB 设计 的 FIR ADOBE UE BEAR I 


例 D.4 M MATLAB 进行 多 带 FIR 滤波 器 的 设计 

该 例 将 前 而 的 3 个 频带 的 滤波 器 例子 扩展 到 有 5 个 频带 、 两 个 通 带 的 滤波 器 的 设计 。 程 序 
mat63.m ( 儿 图 D.7 ) 和 前 面 的 MATLAB 程序 mat33.m 类 似 ， 渡 波 笨 有 两 个 通 带 ， 总 共 由 5 个 频 
带 表 示 : 第 一 个 频带 ( 阻 带 ) 归 一 化 频率 从 0 到 0.1 (0 Hz 至 500 Hz ), 对 应 的 幅度 响应 是 0; 第 
二 个 频带 ( 通 带 ) 归 一 化 频率 从 0.12 到 0.18 (600 Hz 至 900 Hz), 如 应 的 幅度 响应 为 1， 依 次 类 
推 。 滤 波 器 的 参数 概述 如 下 : 


频带 号 ME Hz) YA HF 幅度 响应 - 


i 0-500 0-0.1 0 
2 600-900 0.12-0.18 1 
3 1000-1500 — 02-03 0 
4 1600-1900 0.32-0.38 1 
5 2000-5000 — 04-1 0 


&Mat63.m MATLAB program for two Dassbands, 63 coefficients Fs=10 kHz 


nu- [0 0.1 0.12 0.18 0.2 0.3 0.32 0.38 0.4 1]; Snormalized frequencies 


mag= [00 12110 01 1 9 0]; magnitude at normalized frequencies 
c-remez (52,nn,mg); &invoke remez algorithm for 63 coeff 
bpé3sc'; % coeff values transposed 

save mat2bp.cof bp63 -ascii; $save in ASCII file with coefficients 

(h,w] =freqz (c,1,256); frequency response with 256 points 

plot [(500*nu,mag,w/pi,abs(h)) *plot ideal magnitude response 


& D.7 用 于 两 个 通 带 的 FIR HSE AY MATLAB 程序 【mat63m ) 
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在 MATLAB 中 运行 该 程序 ， 检 验 图 D.8 所 示 的 两 个 通 带 的 滤波 器 的 幅度 响应 〈 理想 状态 )。 
该 程序 产生 63 个 一 组 的 系数 ， 并 世 ASCII 格式 保存 在 系数 文件 mat2bp.cof 中 。 
1.2 


1 
0.8 
0.8 


0.4 


o 
0 1000 2000 3000 4000 5000 


图 D.8 H MATLAB 设计 的 两 个 通 带 的 FIR 滤波 器 的 频率 响应 
D.4 用 学 生 版 MATLAB 进行 IIR 滤波 器 的 设计 
学 生 版 MATLAB 也 可 用 于 HIR 滤波 器 的 设计 。 也 可 参见 D.2 35, Hi MATLAB 的 GUI 滤波 器 
设计 工具 SPTOOL 进行 IIR 滤波 器 的 设计 。 
例 D.5 用 学 生 版 MATLAB 进行 IIR 滤波 器 的 设计 
MATLAB 函数 yulewalk 基于 最 优 最 小 平方 拟 合 方法 ， 可 以 用 于 设计 递归 式 滤波 器 。 重 新 考虑 


图 D5 中 的 MATLAB 程序 mat33.m, 得 到 一 组 33 个 系数 的 FIR 带 通 滤波 器 ， "其 中 心 频率 为 1000 Hz, 
用 下 面 命令 代替 remez 函数 进行 FIR 滤波 器 的 设计 : 


>>fa,b}] = yulewalk{n, nu, mag) 


执行 这 条 命令 , 返回 系数 a Hb BOE, 这 些 系 数 对 应 第 5 章 讨 论 的 OR 滤波 器 通用 输入- 输出 等 式 
中 的 系数 ， 滤 波 器 阶 数 = 表示 二 阶 单元 的 个 数 。 例 5.1 89 C 程序 利用 级 联 二 阶 单元 实现 HR 滤波 
器 ， 这 也 是 最 常用 的 实现 方法 。 例 如 ， 如 果 yulewalk BAH n= 6, 根据 MATLAB 得 到 的 系数 a 
Alb, 5B 5 章 中 通用 传输 函数 将 三 个 级 联 单元 变 为 “个 一 阶 单元 。 


D.5 用 MATLB 和 支持 程序 及 双 线 性 变换 方法 实现 滤波 器 设计 


本 节 对 5.3 节 讨 论 的 双 线 性 变换 方法 进行 了 扩 展 。 


练习 DA 一 阶 ITR 低 通 滤波 器 


假设 一 个 一 阶 模拟 低 通 系统 传输 函数 HS) ， 可 以 得 到 对 应 的 离散 时 间 滤 波 器 的 传输 函数 为 
A(z), 令 带 宽 或 截止 频率 B= 1 rad/s, HERH F, = 10 Hz, 


l. 选择 一 个 合适 的 传输 函数 : 
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1. 
HG) =F 


它 表示 一 个 带宽 为 ] rad/s 的 低 通 滤波 器 。 
2、 用 下 式 对 wp 进行 非 线性 变换 : 





其 中 mp = B=1 rad/s, T=1/10, 
3. 消除 H(s) 分 子 分 母 公 因子 ， 可 得 ， 


1 
H(s/a4}= 20:41 
4. 求 得 要 求 的 传输 函数 H(z) ， 也 就 是 : 
Hi2) = A(s/@ A), = zs 


练习 D.2 — IR 高 通 滤波 器 
假设 一 个 高 通 传输 函数 H(S) = si(s + 1) ， 得 到 相应 的 传 连 函 数 H(z) 。 令 带宽 或 截止 频率 为 
l radis， 抽 样 频率 为 5 Hz， 由 前 面 的 所 述 过 程 ， 可 得 H(z) 为 : 


- 10(z—1) 
H= > 


练习 D.3 二 阶 OR 带 阻 滤波 器 
假设 一 个 二 阶 带 阻 滤波 器 的 模拟 传输 函数 为 HS) ， 可 得 对 应 的 离散 传输 函数 为 H(z) , 令 低 


截止 频率 和 高 截止 频率 分 别 为 950 Hz 和 1050 Hz, MESZ F 为 5 kHz, 
选择 的 带 阻 滤波 器 的 传输 落 数 为 ; 


FUP BAD o, 分 别 为 带 寅 和 中 心 频率 ， 模 拟 频率 为 : 


© tan 92:4. Ont =tan 27 x 950 
as 2 2 x 5000 

_,. @p2T _. 2x x 1050 

Q4) = tan) = tan 5000 


带宽 B= Baz 一 的 41 = 0.096 , w = (@41)(@42) = 0.5271, 传输 函数 H(s) 变 为 : 


s? +0.5271 
H(s) = ——————————— D.1 
3) = 0096: «05771 (D4) 


对 应 的 传输 函数 H(z) 可 由 s = (z - 1y(z1) BB, BD; 





= 0.6796 





= 0.7756 


{(z-D/(z+ DY + 0.5271 


H(z)- 7 
[(z - D/(z-- 1) + 0.096 (z — 1)/(z +1) + 0.5271 


也 可 以 简化 为 : 
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0.9408 — 0.582771 + 0.9408 z7 
1- 0.582727 + 0.881727 
SUGAR, A(z) 可 用 程序 BLT.BAS ( 在 辅助 材料 中 ) 或 MATLAB 进行 检验 , 或 者 和 我 们 


STARR, FH BIT 方法 由 He) 计算 出 A(z) 。 利 用 该 设计 过 程 进 行 高 阶 滤波 器 的 设计 也 是 
非常 有 用 的 。 


练习 DA 四 阶 BR 带 通 滤波 器 
利用 BUT 方法 可 以 设计 四 阶 TIR 带 通 滤波 器 ， 令 低 截 止 频率 和 高 截止 频率 分 别 为 1 kHz 和 
1.5kHz， 抽 样 频 率 为 10 kHz. 


|. 四 阶 巴特 沃 斯 带 通 滤波 器 的 传输 函数 HG) 可 以 从 二 阶 巴 特 沃 斯 低 通 滤波 器 的 传输 函数 得 
al, RẸ: 


H(z) = (D) 


HG) - Hiks) (000)ss o 
其 中 ， Hipls) 是 二 阶 巴特 沃 斯 低 通 滤波 器 的 传输 函数 。 这 样 ， 五 (s) 就 变 为 
Als) = 





e=(s?-+07}/sB 
ey; | i (D.3) 
~ 59 + V2 Bs? + (2? + B?)s? + 2 Bos c af 
2. RFR Oar 和 O42 为 : 


1 
st4+V2s41 








QA = tan 22T =tan 2 10.009 -0.3249 
Q4, =tan Sat. tan > x Dx = 0.5095 
3. 现在 可 求 得 中 心 频 率 o. 和 带宽 B: 
€? = (0 4) XO 42) = 0.1655 
B=@4.-O, = 0.1846 
4， 模 拟 传输 函数 HG) 可 以 简化 为 : 
HO= Ti DAD 
5. 相 庶 的 H(z) 变 成 : 
加 = — 02008 004016: «0020087 _ - 004016: + 0.020087" (D.5) 
1—2.549527 + 3.20212? — 2.03592? +0.64137 z7” i 


该 式 是 用 式 〈5.4 ) 的 形式 来 表示 的 ， 可 用 BLT.BAS 程序 对 其 进行 检验 。 
5&3] D.5 Fl MATLAB PRIMM RAE HC) 转换 成 A(z) 
用 练习 D.3 中 的 二 阶 HR 带 阻 滤波 器 ， 模 拟 * 平面 的 传输 函数 [ 见 式 ( DD.1 ]: 


s? 40.5271 
H()e—— 29921 .— 
(5) = 10096505771 
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可 以 用 MATLAB PAAR LR FAO ERA S Oh EE OP D 0] PR OR 
MATLAB 命令 如 下 : 


»»num = {1, 0, 0.5271]; .: $numerator coefficients. - 
>>den = [1, 0.096, 0.5271]; &denominator coefficients. 
>>T = 2; Fs = 1/T; $K=1 from bilinear equation 


>>(a,bj=bilinear (num, den, Fs) Sinvoke bilinear function 


得 到 式 (54) 中 的 传输 函数 相应 的 系数 a 和 5， 即 : 


0.9409 — 0.58272! + 0.940927 
1- 0.582727 + 0.881727 


该 传输 函数 和 练习 D.3 所 得 到 的 传输 函数 D.2 ) 是 一 样 的 。 注 意 ， 为 了 方便 起 见 ， 在 MATLAB 

中 选择 T= 2 ， 关 为 在 第 5 章 中 的 双 线 性 等 式 的 常数 六 = 2/T- SOS 1。 同 时 注意 MATLAB 中 使 

用 的 通用 输入 输出 方程 m 
yn) = byx(n)* bxin - 1) 5x(n-2) * ---—amy(n-1) - a, y(n—-2)- --- 

由 上 式 可 得 如 下 所 示 的 传输 是 数 : 


H(z)= 


名 十 六 2 + to 


Híz)- 
( ) 1-az! tài? Tee 


EARI MATLAB 的 系数 a 和 上 4 与 式 (5.1) 中 系数 的 顺序 是 相反 的 。 


练习 D.6 用 实用 程序 BLT.BAS 把 H(s) 转换 成 H(z) 

BLT.BAS 是 一 个 非常 有 用 的 程序 ， 它 是 用 BASIC 编写 的 , 可 以 把 模拟 的 传输 函数 HS) 用 双 
线性 变换 公式 s = (z - 1y(z + 1) 转换 成 相应 的 传递 函数 H(z) 。 为 了 检验 练习 D.3 中 二 阶 带 阻 滤 
波 器 式 CD.) 的 结果 , 运行 GWBASIC, 然后 调 人 并 运行 程序 BITBAS， 房 幕 上 出 现 奶 图 D.9 (a) 
所 示 的 提示 符 和 与 H(s) 相关 的 系数 a A b, 与 传输 前 数 H(z) 相应 的 系数 a Al b MN D.9(b) 所 示 ， 
这 些 数据 验证 了 式 (D.1 ) 的 正确 性 。 再 运行 程序 BLT.BAS, 使 用 式 (DA) 中 的 数据 验证 式 (D.5) 
的 正确 性 。 


Enter the # of numerator coefficients (30 = Max, 0 = Emit) --> 3 
Enter a(Qjs*2 --> 1 
Enter aí(1)s^l --- 0 


Enter a(2)8^0 --> 0.5271 


Enter the # of denominator coefficients --» 3 
Enter bí(0)8^2 <--> 1 
Enter bí(1)s^i --- 0.096 
Enter bí(2)s^0 --> 0.5271 


Are the above coefficients correct ? (y/n) y 
fay “平面 的 系数 


a(0)z^-0 = 0.94085 b(0)z^-0 = 1.00000 

a(1)z^-1 = -0.58271 b(l)z^-1 = -0.58271 

a(2)z^-2 = 0.94085 b(2)?z2^-2 = 0.88171 
w :平面 的 系数 


D9 应 用 程序 BLT.BAS 进行 双 线性 变换 
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练习 D.7 用 实用 程序 AMPLITCPP 求 出 幅度 和 相位 瑰 应 

使 用 C++ 语言 程序 AMPLIT.CPP(C 在 辅助 材料 中 ), 可 以 画 出 最 大 阶 数 为 90, 传输 函数 为 A(z) 
的 给 定 滤波 器 的 幅度 和 相位 响应 。 编 译 {用 Borland CHANDER ) 并 运行 该 程序 ， 输 大 练习 D3 
中 如 图 D.10(a) 所 示 的 对 应 二 阶 带 阻 滤波 器 (D.2 ) 传输 栈 数 的 系数 ， 图 DIAR D.10(e) 分 别 


给 出 了 该 二 阶 带 阴 滤 波 器 的 幅度 和 相位 响应 。 从 H(z) 的 幅度 响应 图 中 ， 可 以 看 出 归 一 化 中 心 频 
Xv = filFy = 1000/2500 =0.4。 





' . . . 1 
F! HELP — F5QUIT Fi0 PLOT 归 一 化 频率 = pH 
. 接 Fl 打印 输出 $& Enter HR 
(a) zz 平面 的 系数 ”里 一 化 幅度 响应 


a 
0.0 


-1.57 
0 


HE 


0.2 0.4 0.6 0.8 1 
AARE = (Hf 
HEFTY 按 Enter Beet 
(c) 归 一 化 相位 响应 


图 D.i0 应 用 程序 AMPLIT.CPP 曾 出 幅 频 和 相 频 响应 
重新 运行 该 程序 ， 曾 出 练习 D4 中 的 四 阶 带 通 OR 滤波 器 的 粘度 响应 ， 检 验 图 D .1 的 结果 ， 
归 一 北 中 心 频率 y = 1250/5000 = 0.25, 


应 用 程序 MAGPHSE.BAS (在 辅助 材料 中 ) 是 用 BASIC 语言 编写 的 ， 可 用 该 程序 把 幅度 利 
相位 响应 制 成 表格 的 形式 。 . 
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-— 


9 0.2 0.4 0.6 . 08 


f£ Fl 打印 输出 按 Enter 继续 
图 D.11 程序 AMPLIT.CPP 画 出 的 四 上 阶 带 通 TR 滤波 器 的 幅度 响应 


D.6 FFT 和 IFFT 
MATLAB 可 用 来 求 序列 的 快速 Fourier HELI Fourier 342% IFFT, 


练习 D8 FR MATLAB 实现 8 点 的 FFT 30 IFFT 


练习 6.1 中 的 8 点 FFT 可 以 很 容易 地 用 MATLAB 进行 检验 ， 使 用 下 面 的 命令 ， 
MX [i1i1100200]; 
>> = fftíx) 
>>magy = abs(y) 
>>plot (magy) 
FFT 变换 的 幅度 谱 也 用 图 形 的 方式 给 出 了 。 
同样 地 ， 也 可 以 检验 IFFT， 假 定 练 习 6.1 为 输出 序列 ， 用 IFFT 可 以 求 得 ; 
>>X = [4 1-2.414*i 0 i1-0.414*i 0 1-0.414*i 0 1+2.414*i]; 
>>y = ifft(X) 


这 里 ， 矩 形 序列 就 是 求 得 的 结果 。 
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Bia E 其 他 的 支持 工具 


还 有 下 面 的 一 些 支持 工具 可 以 利用 〈 和 参见 附录 了 中 的 MATLAB 支持 ): 


. 用 于 产生 信号 的 Goldwave 工具 软件 、 虚 拟 仪器 等 。 

. MuitiDSP 公司 用 于 FIR 和 OR 滤 流 器 设计 的 DigiFilter TA. 
.自制 的 滤波 器 开发 包 。 

. 可视化 应 用 程序 开发 环境 软件 (VAB )。 

. 集成 DSP 的 编 解 码 器 支持 工具 。 

. MATLAB 的 开发 工具 包 。 


EA 作为 虚拟 仪器 的 Goldwave 共享 工具 


Goldwave 是 一 个 共享 工具 软件 , 它 可 以 把 PC 声卡 变 成 一 个 虚拟 入 器 .Goldwave 可 以 从 Web 
上 下 载 山 ， 该 工具 通过 生成 一 个 函数 发 生 器 来 产生 不 同 的 信号 ， 比 姐 正 芝 信 和 号 和 随机 咯 声 , .也 可 
以 用 做 示 菠 器 或 频谱 分 析 仅 ， 并 且 能 记录 .、 编 辑 一 段 语音 信 导 ， 可 以 得 到 如 回声 和 小 波 等 声音 效 
A, AH. RH. HAASE Gods 工具 在 声卡 上 实现 ， 也 可 以 很 方便 地 在 
信号 上 加 上 各 种 效果 。 

Goldwave 可 用 来 得 到 一 段 语 音 (TheForce.way， 见 辅助 材料 )， 加 上 频率 分 别 为 900 - Hz 各 
2700 Hz 的 两 个 正弦 信息 ,得 到 一 个 受 干扰 的 语音 信和 号 ， 如 图 4.24 所 示 。 例 47 说 明了 如 何 消除 
SAT ERAS. mn mE 

TE Windows 9x 上 可 所 运行 两 个 Goldwave 程序 ， 一 个 用 来 产生 DSK 的 输入 信和 号 ， 另 一 个 作 
为 DSK 输出 到 声卡 的 频谱 分 析 仪 ， 但 是 运行 两 个 Goldwave 程序 会 使 得 到 的 结果 有 很 多 了 唆 声 。 

其 他 的 共享 程序 ， 如 Cool Edit! ak Spectrogram 申 ， 也 可 以 用 做 虚拟 频谱 分 析 仪 。 


E.2 用 DigiFilter 进行 滤波 器 设计 mE 
DigiFilter 是 一 个 滤波 器 设计 包 ， AAA FIR 和 DIR 滤波 器 设计 向。 现在 ， 它 可 以 和 C31 的 

DSK 接口 ， 实 时 实现 滤波 器 的 设计 。 . 

E.2.1 FIR 滤波 器 设计 


图 E.1 显示 的 是 含有 61 个 系数 的 FIR 带 通 滤波 器 的 对 数 幅 度 响应 ， 其 中 心 频率 为 2kHz， 用 
凯 塞 窗 函 数 实现 。 对 于 特定 的 设计 ,根据 每 种 窗 函 数 ( 矩形 答 、 汉 明 窗 等 ) 的 阶 数 ( 系数 ) 指标 ， 
用 户 可 以 从 几 种 窗 函 数 中 选择 合适 的 窗 函 数 ， 如 图 'E.2 所 示 。 脉 济 响应 和 阶 路 响应 都 可 以 得 到 。 
注意 用 汉 明 窗 函 数 实现 需要 89 个 系数 ， 然 而 用 凯 塞 窗 函数 实现 只 需要 61 个 系数 ( 见 图 E.2 ), 


Mm th b w N e 


0 


-39. 


-59 。 


-79. 


-99 


MRE 其 他 的 支持 工具 


对 数 幅度 响应 





.000 





.833 





498 








.163 


0.000 
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用 DigiFilter 设计 的 FIR 带 通 滤波 器 的 幅度 响应 
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用 DigiFilter 设计 的 FIR 滤波 器 的 响应 
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E22 HR 滤波 器 设计 

用 DigiFilter 工具 可 以 很 方便 地 设计 一 个 IR 滤波 器 。 滤波 器 类 型 可 以 从 下 面 几 种 滤波 器 类 型 
中 选择 ，Butterworth 型 、Chebyshev 型 、 椭 加 型 和 Bessel 型 ， 每 种 都 有 其 特定 的 滤波 器 阶 数 。 和 
FIR 滤波 器 设计 一 样 ， 可 以 得 到 滤波 器 的 幅度 响应 以 及 H(z) 的 零点 、 极 点 图 。 


E. 用 滤波 器 开发 包 进 行 FIR 滤波 器 设计 


这 是 一 个 非 商业 的 滤波 器 开发 包 ( 见 辅助 材料 ), 程序 FIRprog.bas FH BASIC 语言 写成 , 可 以 
计算 FIR 滤波 器 的 系数 ， 在 参考 文献 5 至 7 中 讨论 了 该 程序 的 功能 。 它 可 以 设计 低 通 、 高 通 、 带 
通 和 带 阻 FIR SEDES, TER. TR A, RRS A, ARAL 
用 整数 或 浮 点 格式 表示 。 该 程序 尚 需要 修改 并 合并 成 一 个 通用 的 FIR 设计 程序 。 


E.3.1 凯 塞 窗 


1. 启动 BASIC, 然后 装 人 并 运行 程序 FIRprog.bas, 图 E.3 (a) 和 图 E3 (b) 显示 了 可 以 选择 的 
窗 函 数 和 选 频 滤波 器 类 型 。 选 择 凯 塞 窗 选 项 和 带 站 滤波 器 ， 这 样 就 在 FIRprog.bas 中 调用 
了 一 个 独立 的 凯 塞 窗 ( FIRproga.bas ) 的 滤波 器 模块 。 

2. 如 图 E.3 (c) 所 示 ， 输 人 滤波 器 的 系数 ， 选 择 选 项 c31， 把 所 得 的 53 个 系数 保存 到 一 个 文 
件 中 ,其 数据 格式 是 浮 点 型 (选项 C25 表示 把 系数 用 十 六 进 制 进行 存储 )。 把 结果 存 人 文 
件 BP53K.cof. 

3. 编辑 该 文件 ( 辅助 材料 中 有 已 经 编辑 好 的 文件 )， 把 该 程序 包含 到 例 44 中 的 程序 
FIRPRN.c 中 , 运行 程序 并 用 HP 分 析 仪 检验 是 否 为 中 心 频 率 为 800 Hz 的 FIR 带 通 滤波 器 
的 频率 响应 ,结果 如 图 EE4。 在 程序 HRPRN.c 中 ， 用 内 部 产生 的 一 个 桌 声 序列 作为 FIR p 
波 器 的 输入 ， 在 该 波 波 需 设 计时 ， 中 心 频率 设置 为 1000 Hz( F/A0), dE PERDE 10 000 Hz. 
因为 我 们 在 DSK 中 采用 8kHz 的 抽样 频率 ， 所 以 中 心 频率 就 是 800 Hz, 如 图 E.4 所 示 。 


E.3.2 AR 


用 汉 明 窗 函数 重复 上 面 的 步 双 ， BARONE: 1100 Hz 和 900 Hz, 输入 5.2 (ms) 
作为 脉冲 响应 持续 时 间 D, 因为 系数 的 个 数 NH C .. 
|. Ns(DxF, T 1 


这 样 ， 得 到 一 个 53 个 系数 的 滤波 器 设计 ， 把 结果 存 人 文件 BPS3H.cof 中 。 EIEN, 
编辑 该 文件 ， 用 程序 FIRPRN. c 测试 并 检验 FIR THOU MORE, D 


E.4 图 形 化 应 用 程序 开发 环境 软件 


图 形 化 应 用 程序 (VABY: FARTI Hyperception ARE 它 是 -个 基于 组 件 
的 可 视 化 设计 工具 ， ,TT DSP 算法 。 : 
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Main Menu 


1 . RECTANGULAR 
2 . HANNING 

3. . . .HAMMING 

4. . . .BLACKMAN 

5 .KAISER 

6 .Exit to DOS 


Enter window desired (number only) -> 5 
(a) 


Selections: 
1, . LOWPASS 
2. .HIGHPASS 
3. - BANDPASS 
4, . BANDSTOP 
5. . .Exit back to Main Menu 


Enter desired filter type (number only) -> 3 
(b) 


Specihcations: 
BANDPASS 
Passband Ripple (AP) = 6 db 
Stopband Attenuation (AS) = 30 db 
Lower Passband Frequency 
Upper Passband Frequency = 1100 Hz 
Lower Stopband Frequency = 600 Hz 
Upper Stopband Frequency = 1400 Hz 
Sampling Frequency (Fs) = 10000 Hz 


H 
ua 
a 
D^] 
m 
N 


The calculated # of coefficients required is: 53 


Enter # of coefficients desired ONLY if greater than 53 
otherwise, press «Enter» to continue -> 


(e) 


Send coefficients to: 
íS)creen 
(iP)rinter . 
(Flile: contains TMS320 (C25 or C31) data format 
(R)eturn to Filter Type Menu 
(E)xit to DOS 


Enter desired path --» f 


Enter DSP type (C25 OR C31):? c31 
(d) 


$$ eee 
HE3 用 滤波 器 设计 坎 件 包 设计 FIR 滤波 器 : (a) ERR 
数 ; (b) DEDEGEOE SI; (c) 滤波 器 特性; (d) 系数 格式 菜单 
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By STATUS: PAUSED 
RANGE? 3 d ansi TOG 











Hz STOP: 2 388 Hz 


图 E.4 系数 文件 BP53K.cof 对 应 的 带 通 FIR 滤波 器 的 频率 响应 


VAB 的 使 用 方法 很 简单 ， 可 以 角 过 用 和 鼠标 连接 不 同 的 组 件 来 方 恒 地 实现 DSP 算法 。 用 户 只 
需要 选择 相应 的 阔 数 ， 把 这 些 函数 放 进 工作 表 中 ， 选 择 它们 相互 间 的 参数 ， 并 且 用 连 线 来 描述 数 
据 流 即 可 。 设 计 方 法 非常 像 夯 一 张 系统 的 设计 框图 ， 基 于 DSP 的 设计 和 实现 可 以 在 DSP 硬件 上 
BEARES, AS SRB. 

VAB 包括 使 用 范围 很 宽 的 范 数 模块 组 件 , 可 以 完成 FFT、 滤波 等 , 并 且 支 持 C6711 DSK. 
在 儿 分 种 内 就 可 以 设计 和 测试 一 个 DSP 系统 ， 包 括 的 函数 模块 有 信和 号 发 生 器 、AD 和 DIA, 
沥 波 器 、FEFT、 图 形 处 理 组 件 等 。 设 计 的 结果 可 以 很 快 地 在 PC 的 明示 器 上 显示 出 来 ， 就 如 但 
算法 是 在 外 部 运行 而 在 示 波 妖 上 显示 一 样 。 图 E.5 显示 了 一 个 Vocoder 在 C6711 DSK 上 的 实 
现 框 图 。 


ES 其 他 小 的 支持 工具 


我 们 可 以 得 到 下 面 的 支持 工具 (也 可 和 参见 附录 D 的 MATLAB 和 附录 下 的 基于 PCM3003 编 
解码 器 的 音频 子 板 ): 


1， 基 于 ADT? 立体 声 编 解码 器 的 音频 子 板 ， 可 以 接口 到 Cox 的 DSK 上 ， 可 以 从 集成 DSP 
AASB", 

2. TI 公司 的 DSPFRTA A, HUA TI 公司 的 软件 和 硬件 把 MATLAB 和 SIMULINK 
连接 起 来 , 它 注重 代码 的 优化 、 测 试 和 分 析 , 而 不 是 重 写 DSP 算法 ,现在 它 支持 基于 C6701 
的 评估 版 模块 (EVM X, 
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Goldwave, at www.goldwave.com. 
Cool Edit, at www.syntrillium.com. 


Gram412.zip from Spectrogram, address from shareware utility with the database 
address www.simtel.net. 


DigiFilter, from MultiDSP. at multidsp@aol.com. 


R. Chassaing, Digital Signal Processing Laboratory Experiments Using C and the 
TMS320C31 DSK, Wiley, New York, 1999. 


R. Chassaing, Digital Signal Processing with C and the TMS320C30, Wiley, New York, 
1992. 


R. Chassaing and D. W. Horning, Digital Signal Processing with the TMS320C25, Wiley, 
New York, 1990. 


Hyperception, at info@hyperception.com. 
Integrated DSP at www.integrated-dsp.com. 


The MathWorks, Inc., at www.mathworks.com. 





”附录 用 PCM3003 立体 声 
| 纺 解 码 器 作为 输入 输出 


F1 pCM3003 RIA Us 


PCM3003 立体 声 编 解码 器 ! 四， 是 AD535 编 解码 器 的 替代 产品 ， 它 的 抽样 速率 较 高 ， 接 
73 kHz， 有 两 个 完整 的 输入 输出 声 道 。 和 PCM3003 | —j FR :有 一 一 个 不 网 MENER 
C6xdskinit_pem.c (代替 C6xdskinit.c ) 议 及 包括 原型 函数 的 头 文 件 、 Cóxdskinit, pem.h CRE 
Cóxdskinit.h ).. 下 面 举 儿 个 例子 来 说 明 具 有 两 个 输入 的 立体 声 编 解码 器 BCGM3003 的 使 用 。 

FE ERI 是 一 个 相对 比较 便宜 的 (50 美 元 ) PCM3003 BOT E Rc 由 TUAE, 
该 音频 子 板 可 以 播 人 DSK 中 ， 也 可 以 和 TMS320C3x 接 日 : 它 和 DSK 相思 时 要 揪 进 3SK 上 的 
80 针 的 接口 JP3 上 (DSK 上 的 另 一 个 80 针 的 接口 TI 包括 数据 线 和 地 址 线 ) 

通过 音频 子 板 的 接口 JP5, 可 以 设置 号 线 来 选择 固定 48 kHz 的 抽 祥 频率 或 一 个 可 编程 希望 的 
抽样 速率 。 从 图 R1 可 知 ， 连 接 位 置 3 和 位 置 4 上 的 跳 线 可 可 得 到 48 kHz 的 抽样 频率 ， 因 为 这 个 跳 
线 连 接 到 了 音频 板 的 12.288 MHz 的 时 钟 上 上 了 ， 困 此 


F, =12.288 MHz/256 = 48kHz 


连接 位 置 1 和 位 置 2 上 的 跳 线 ， 可 通过 timer 0 得 到 可 变 的 抽样 频率 户 ， 在 程序 中 可 以 设置 
希望 的 抽样 频率 oF, (RAE RAGE AE 48 kHz). F, 基 全 局 的 ， 实 际 的 抽样 师 率 由 通 迟 支持 文件 
Cóxdskinit, pem.c 计算 出 来 。 表 E1 举例 说 明了 如 何 计算 希望 的 抽样 频率 和 相应 的 实际 抽样 频率 。 


RFI 希望 的 抽样 频率 和 实际 抽样 频率 的 对 昭 





希望 的 抽样 频率 F, (Hz) 实际 的 抽样 频率 F, (Hz) 
8000 8138.021 
16000 14648.438 
20000 18310.547 
48000 36621.094 ( JPS 跳 线 设置 在 可 变速 率 位 置 ) 
48000 48000 (IPS 跳 线 设置 在 固定 速率 位 置 ) 


>48000 73242.187 ( IP5 中 线 设置 在 可 变速 率 位 置 ) 
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附录 下 用 PCM3003 立体 声 编 解码 器 作为 栓 入 输出 
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Al C6711 DSK 接口 的 PCM3003 音频 子 板 原理 图 ( 续 ) 


F.1 


图 


和 C6711 DSK 接口 的 PCM3003 F TREME 续 ) 


图 Fi 
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要 想 获 得 一 个 希望 的 可 变 抽 样 频率 F,， 可 在 程序 "C6xdskinit_pem.c 中 用 希望 的 频率 (可 在 程 
序 中 设置 )、 时 钟 频率 150 MHz/4 和 每 个 采样 点 256 个 时 钟 来 计算 得 出 ， 可 得 到 的 最 大 抽样 频率 
为 73 242.18 Hz (尽管 本 公司 不 推荐 使 用 > 48 000 Hz 的 抽样 频率 )。 

附录 中 ， 音 频 子 板 上 的 两 个 专用 接 日 ( 立体 声 到 单 声 道 ) 用 于 例子 里 。 这 种 接口 有 两 个 输 人 
和 一 个 单 端 输出 接口 ， 从 每 个 输入 声 道 中 得 到 16 位 数据 值 ， 再 从 单 端 输出 接口 得 到 32 位 的 结果 
数据 输出 ( 其 中 每 个 声 道 16 位 ) 这 个 32 位 的 输出 接口 连接 到 音频 板 , 输入 到 PCM3003 编 解码 
器 上 。 两 个 输入 接口 中 ， 银 色 的 为 左 声 道 ， 金 色 的 为 右 声 道 。 


F.2 ”使 用 PCM3003 编 解 码 器 的 例子 


PFI 使 用 PCM3003 立体 声 编 解码 器 的 自 环 程序 
图 E2 给 出 了 程序 loop_poll_pem.c， 该 程序 用 PCM3003 实现 了 一 个 环 ， 也 可 参见 例 2.2。 本 
和 例 使 用 板 上 的 AD535 RABEKA. 


/floop_poll_pem.c Loop program with polling using PCM3003 codec 
float Fs - 16000.0; l //desired (Actual=14,648 Hz) 


void main{} 

1 
comm_poll (); /finit DSK,codec,McBSP 
whileil) /finfinite loop 
output left sample(input left sample()); //IN from left,OUT from left 

} . . 





图 F2 使 用 PCM3003 立体 声 编 解码 器 的 自 环 程序 (100p. poil eme) 


RI SERO F, 

在 程序 中 ， 确定 希望 的 频率 F,= 16000 Hz, JP5 的 跳 线 应 应 该 设置 在 位 置 1 和 位 置 2. 上 。 实 际 
的 抽样 频率 在 Céxdskinit_pom.c 中 计算 为 : | 

Fs =i4 648.438H2 


分 频 器 的 值 设置 为 5 ( 分 频 器 的 设置 为 整数 )。 

建立 工程 loop. poll pcm， 工 程 中 除了 loop_poll_pem.c, 还 包含 两 个 源 文件 Coxdskinit pem.c 
和 vectors.asm., 

输入 幅度 大 约 为 1 VY、 频 率 为 1 kHz 的 正弦 信和 导 ， 观 察 相应 的 输出 是 否 为 输入 的 延迟 。 将 输 
人 频率 提高 到 7 了 kHz 以 上 ， 验 证 抗 混 玛 滤波 器 的 带宽 是 否 约 为 68 kHz. . 

选择 View—Quick Watch fif 中 来 观察 实际 的 抽样 速率 F,_actual, 验证 它 是 不 是 14 648.438 Hz 

(窗口 显示 这 个 速率 )。 i 

固定 的 F, = 48 kHz 

把 JP5 的 跳 线 设置 在 位 置 3 和 位 置 4 上 ， 得 到 一 个 固定 的 抽样 频率 ， 这 时 在 程序 中 设置 F， 
是 不 起 作用 。 重 新 建立 和 运行 程序 ， 图 F3 显示 了 用 噪声 作为 输 人 时 ， 在 HP 分 析 仪 上 显示 的 纺 
解码 器 的 输出 。 该 图 说 明了 抗 混 秋 滤波 器 的 带宽 大 约 为 21.5 kHz, 

载 大 输入 正弦 信和 叶 的 幅度 ， 当 输入 电压 超过 的 3.5V 时 ， 验 检 输 出 是 否 饱和 了 。 

用 不 同 声 道 的 输 人 输出 进行 实验 ， 如 ; 
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output sample(input sample()])]; 


RANGE: -i @BY STRTUS 
. RAS. 





图 FE.3 抽样 速率 为 固定 F, = 48 kHz, 当 用 随机 噪声 作为 输 
人 时 ,在 HP 分 析 仪 上 显示 的 输出 频 订 用 loop_boln_ pem ) 


得 到 一 个 32 位 的 数据 (每 个 声 道 16 位 )， 可 用 一 个 单 声 道 接口 输入 ， 上 默认 状态 下 用 右 声 道 (E 
色 ) 作答 出 。 左 声 道 的 接口 。 但 是 ; 


output right sample(input left sample); 
要 求 立体 声 至 单 声 道 接 日 ， 用 左 声 道 (银色 ) 作 输 入 ， 用 右 声 道 { 金色 ) 作 输 出 。 


Ñi F2 在 PCM3003 编 解 玛 器 上 司 用 中 断 的 自 环 程序 


该 例 说 明了 PCM3003 编 解 码 器 采用 中 断 驱 动 的 自 环 程序 。 例 Fl! 说 明 使 了 使 用 轮 询 的 自 环 程 
序 特点 ， 也 可 参考 例 2.1 中 板 上 的 AD535 编 解码 器 的 使 用 。 图 . F4 给 出 了 实现 该 例 的 程序 
loop_intr_pem.c. 


//loop intr pem.c Loop program with interrupt using PCM3003 
" float Fs = 16000.0; //irrelevant since jumper in 3-4 


interrupt void c intl1í() //interrupt service routine 
i 
output left -sampile input. left _sample()}; //IN/OUT Erom left 


return; //return from interrupt 


) 


void maint) 
{ 
Commintr{); /init DSR, codec, Moisp 


) 2. 
~ LL LL 


PH F4 使 用 PCM3003 编 解码 器 带 中 断 的 自 环 程序 〔loop_intr_pemuec ) 
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yr LE loop. intr pem, 34 F, REX 48 kHz ( 跳 线 设置 在 位 置 3 和 位 置 4) 时， 检验 是 否 和 
HFI 中 采用 轮 调 方式 的 自 环 程 序 有 同样 的 结果 。 


HE3 给 出 用 PCM3003 编 解 码 器 实现 FIR 滤波 器 . 

ALES 显示 了 程序 FIR_pcem.c， 该 程序 在 PCM3003 上 实现 FIR RRS., P 4.4 说 明了 如 何 用 
板 上 的 AD535 编 解码 器 实现 FIR 滤波 器 。 滤 波 器 的 系数 文件 bp41.cof 表示 了 一 个 ， 中 心 频率 为 
FJ8 (在 第 4 章 中 使 用 过 )。41 个 系数 的 FIR 带 通 滤波 器 。 四 样 频率 设置 为 固定 的 48 kHz. ( Bae 
设置 在 位 置 3 和 位 置 4 上 )。 





//Fiz_pom.c FIR using PCM3003 codec 


#include "bp4l.cof* //coefficient file BP @ Fs/B 
int yn = 0; ffinitialize filter's output 
short dly[N]; ^ //delay samples '' i 
float Fs = 48000.0; //fxed/actual Fs 
interrupt void c_inti1{} 7 /YSR 
( . 
Short i; 
dly[0] - input left sample(); //newest input @ top of buffer — 
yn = 0; //initíalize filter's output 
for (i = 0; i< N; i++) | 
yn += (h[i] * dly[i]); //y(n)+=h(i) *x(n-1)} : 
for (i = N-i; i > 0; i--) /fstarting @ bottom of buffer 
diy[i] = dlyfi-1]; //update delays with data move 
output right sample(yn »» 15); /foutput filter 
return; — /fxeturn. from ISR 
} . 
void main() 
t | mE 
comm intrí): /finit DSK, codec, McBSP . 
while(i); : ./linfnite loop 


} 














图 FE.5 使 用 PCM3003 编 解码 器 的 FIR 程序 CFIR_pem.c:) 


建立 工程 FIR, pem, 图 E6 为 在 HP 分 析 仪 上 显示 航 用 噪声 作为 输入 的 FIR Wee BRS Ey 
应 , 实际 使 用 的 抽样 频率 是 固定 在 48 kHz. FE ORTMAS 和 位 置 4 上 得 到 固定 的 抽样 
频率 ) 从 图 钟 可 以 看 出 ， 中 心 频率 为 6KHz， 对 应 着 P/8。 — 
改变 跳 线 位 置 , 设置 成 可 变 的 抽样 频率 (位 置 1 和 位 置 2 ), 并 且 在 程序 中 把 只 设置 成 人 kHz 
(或 者 设置 成 任何 介 于 48 kHz 和 72 kHz 之 间 的 频率 )。 在 C6xdskinit_pem.c 中 计算 可 变 分 频 器 在 
这 个 频率 范围 设置 为 1。 建 立 /运行 该 工程 ， 并 检验 FIR 是 否 为 中 心 频率 为 73 248/8 = 9.15 kHz 的 
ER 
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-11 STapus: 
RANGE: ~11 any H L foo "usen 





-se + : 1. : 1 jt : | . 
START: 6 Hr 27 "LE 6. de da H4 Hz STOP: 20 880 Hz 
#1 6000 H 


WEG 在 HP 分析 仪 上 显示 的 中 心 频率 在 FJ8 的 FIR 带 通 滤波 器 的 输出 频率 响应 


例 F4 用 PCM3003 编 解 码 器 实现 消除 噪声 的 自 适应 FIR 滤波 器 

图 F3 ih FLU Adaptnoise _pcme。 该 程序 说 明 的 是 用 PCM3003 立体 声 编 解 码 器 空 现 消除 
噪声 的 自 适应 FIR 滤波 器 。 例 7.2 用 板 上 的 AD535 实现 了 噪声 消除 。 程 序 中 期 望 的 抽样 频率 设置 
为 8kHz， 但 是 实际 的 频率 为 8138.021 Hz。 建 立 工程 adaptnoise_pcm。 


1， 期 望 的 信号 频率 为 1.5 kHz， 不 期 望 的 信号 频率 为 2 Hz。 将 期 望 的 正弦 信号 ( 如 频率 为 
1.5 kHz) 输入 到 左 通道 ， 并 且 将 不 期 望 的 2 kHz 的 正弦 信号 输入 到 右 声 道 。 运 行程 序 ， 
检验 2 kHz 的 噪声 信号 是 否 被 逐 浙 消除 ( 可 在 程序 中 通过 按 因子 10 改变 beta 值 来 调整 收 
AGERE), TIIRA gel 程序 adapmoise.gel， 并 上 且 将 滑动 条 调 到 2 的 位 置 ， 检 验 输出 是 
否 为 1.5 kHz 和 2kHz 的 两 个 原始 的 正弦 信号 。 

2， 期 望 的 信号 为 宽带 随机 噪声 ， 不 期 望 的 信号 频率 为 2kHz。( 从 Goldwave 或 噪声 发 生 器 ) 
输入 随机 品 声 作为 期 望 的 宽带 信号 输入 到 左 声 道 ， 不 期 望 的 2 kHz 正弦 信号 输 人 到 右 声 
道 。 重 新 启动 /运行 程序 ,将 滑动 条 的 位 置 调 到 2 位 着 ,图 8(a) 是 在 HP 分 析 仪 上 显示 的 
期 望 的 宽带 信 叶 和 要 性 不 期 望 的 2 kHz 正 汞 信号 的 输出 烦 谱 ( 福 动 条 的 位 置 为 2) 图 F8G) 
显示 了 不 期 望 的 2 kHz 信号 被 消除 后 宽带 信号 的 输出 频谱 ( 将 动 条 的 位 置 为 1)。 检 验 不 
期 望 的 2 kHz 信号 是 否 被 逐渐 消除 。 

3， 期 望 的 信号 频率 为 2 kHz, 不 期 望 的 信和 号 是 宽带 随机 噶 声 。 交换 接口 的 输入 ， 把 期 望 的 

”2 kHz 信号 接 到 左 声 道 ， 不 期 户 的 随机 只 声 信号 接 到 右 声 道 ， 把 beta 值 增加 100, 重新 启 
SOANE. 检验 随 机 噪声 信号 是 否 被 逐渐 消除 ( 滑动 条 设置 在 1 AR), E FRROK 
了 消除 了 不 期 望 的 宽带 噪声 信和 号 后 的 2 kHz 信号 。 . 


GIES 用 PCM3003 AABN RAREST RAEN 

图 RS 给 出 了 消除 宽带 信 号 中 存在 的 这 带 十 扰 程 序 adaptpredict_pcm， 该 例 用 PCM3003 编 解 
码 器 实现 ， 也 可 参见 例 7.6、 它 通过 板 上 的 AD535 编 解码 器 实现 了 自 适 应 预测 器 。 通过 将 JP5 的 
跳 线 设置 在 男 定 采样 速率 位 置 ， 把 抽样 频率 设置 为 〈《 期望 的 /实际 的 ) 48 kHz。 
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//Adaptnolse_pem.c Adaptive FIR for noise cancellation using PCM3D003 


#define beta 1E-10 //rate of convergence _ 
#define N 30 //* of weights (coefficients) 
#define LEFT 0 //left channel 

#define RIGHT 1 /fright channel 

float wIN]; //weights for adapt filter 
float delay [N]; //input buffer to adapt filter 
float Fs = 8000.0; //sampling rate 

short output; /foverall output 

short out_type = 1; /foutput type for slider 


volatile union{unsigned int uint; short channel[2];)CODECData; 


interrupt void c intll() //ISR 

[ 
short i; 

float yn=0, E-0, dpiusn=0, desired=0, noise-0; 
CODECData.uint = input, sample(); //input 32-bit from both channels 
desired = (float) CODECData.channel(LEFT];  //input left channel 
noise = {float} CODECData.channel[RIGHT]; //input right channel 
dplusn = desired + noise; / /desired«noise 

delay[0] = noise; //noise as input to adapt FIR 
for (i = 0; i < N; i++} //to calculate out of adapt FIR 

yn += (w[i] * delay[il}; //output of adaptive filter 

E = (desired + noise) - yn; . //"error" signal-(id«n)-yn 

for (i s N-1; i »- 0; i--) //to update weights and delays 


w[i] = w[i] + beta*E*delay[il: //update weights 


delay[il = delay[i-1]; //update delay samples 
} 
if (out type == 1) . ://if slider in position 1 
output = ({short}E};  //error signal as overall output 
else if (out type == 2) 
outputz(í (short) pluss}; //desirede*noise 
output left sample(output); //overall output result 
return; 


} 


void main() 


t 


short Tz0; 
for (T = 0; T < 30; T++} 
{ 
w[T] = Q; f/init buffer for weights 
delayIT] = 0; /finit buffer for delay samples 
} 
comm intrí):: //init DSK, codec, McBSP 
while(l); //infinite loop 


] 











图 F.7 在 PCM3003 编 解码 器 上 实现 自 透 应 噪声 消除 的 程序 ( adptnoise, pem.c ) 
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建立 工程 adaptpredict_pem,《 从 Goldwave 或 噪声 发 生 器 ) 输入 随机 噪声 作为 期 望 的 宽带 随 
机 信号 ， 并 输入 IS kHz 信号 作为 不 期 望 的 窄带 干扰 。 图 E10(a) 显 示 了 带 15 kHz JE" TRAS 
宽带 随机 信号 的 输出 频谱 。 图 E100) Gn T PEE DU EET IR BUS HEURE, ME 15 kHz 的 
TOUDETSGEBIBUR T . 
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图 F8 在 HP 分 析 仪 上 显示 的 输出 频率 响应 .(a) JEU RULES, 


不 希望 2 kHz 正弦 信号 ; (b) 期 望 宽带 随机 和 信号， 不 希望 的 
2kHz 信号 被 消除 ; (c) 期 望 2kHz 信和 号, 宽带 随机 信号 被 消除 


m 
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//AMMaptpredict pcm.c Adaptive predictor to cancel interference 


#define beta 1E-15 //rate of convergence 

#define N 60 //* of coefficients of adapt FIR 
#define NS 256 //size of wideband's buffer 

#define LEFT 0 //left channel 

#define RIGHT 1 //right channel 

const short bufferlength = NS; /fbuffer length for wideband signal 
short splusn[N+1]; //buffer wideband signal+interference 
float w[N*1]: //buffer for weights of adapt FIR 
ficat delay([N+1]; //buffer for input to adapt FIR 
float Fs = 48000.0; //for fixed Fs 

volatile union (unsigned int uint; short channel[2];)CODECData; 
interrupt void c intl1() //ISR 

{ 

Static short buffercount=0; /finit buffer 

short i; . . . 

float yn, E; //yn-out adapt FIR, error signal 
short wb signal; //wideband desired signal 

short noise; //external interference 


CODECData.uint = input sample(); //input left and right as 32-bit 
wh signal = (float) CODECData.channel[LEFT]; //desired on left channel 


noise = (float) CODECData.channel [RIGHT]; /fnoige on right channel 
splusn(0] = (wb signal + noise); //wideband signal+interference 
delay[0] = splusn[3]; //delayed input to adaptive FIR 
yn = 0; //init output of adaptive FIR 
for (i = 0; i < N; i++) 

yn += (wfi] * delay[il]); | //output of adaptive FIR filter 
E = splusn[0] - yn; . //{wideband+noise)-out adapt FIR 


for (i = N-i; i >= 0; i--) 
{ 
wli] = wlil«(beta*E*delay[il]; //update weights of adapt FIR 


delay[i+1] = delay[i]; //update buffer delay samples 
splusn[i+i] = splusníil: //update buffer corrupted wideband 
} . 
buffercount++; ` //incr buffer count of wideband 
if {buffercount >= bufferlength) //if buffer count-length of buffer 
buffercount - 0; //reinit count i 
output left sample(íi(short)E); //overall output from left channel 
return; 


} 


void main{} 


{ 
int T = 0; 
for (T = 0; T < N; T++}) //init variables 
i 
w[T] = 0.0; //init weights of adaptive FIR 
delay[T] = 0.0; //init buffer for delay samples 
splusn[T] - D; //init wideband«interference 
) 
comm intrí(); //init DSK, codec, McBSP 
while(1):; /f/infinite loop 


} 





图 F9 用 PCM3003 编 解码 器 实现 自 适应 预测 的 程序 ( adaptpredict_pcm.c ) 
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图 F10 在 HP 分 析 仪 上 显示 的 自 适应 预测 器 的 输出 频谱 . (a) 期 望 的 宽带 随机 信号 和 

15 kHz 的 容 带 干扰 ; (b) 期 望 的 宽带 随机 信和 号 ，15 kHz 的 罕 带 干扰 被 消除 
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附录 G 用 于 实时 数据 变换 的 
DSP/BIOS 和 RTDX 


DSP/BIOS 为 CCS 提供 了 实时 分 析 、 列 表 和 数据 交换 的 功能 中 ， 当 数字 信号 处 理 器 ( DSP ) 
正在 运行 时 ， 可 以 用 DSP/BIOS 来 分 析 应 用 程序 ( 目标 处 理 器 不 需要 停止 运行 )。 有 很 多 种 
DSP/BIOS 应 用 程序 接口 (API) 模块 ， 用 来 实时 分 析 、 输 入 /输出 等 。 包 含 在 CCS 中 的 API 程 序 
可 以 用 来 配置 和 控制 编 解码 器 的 操作 ， 这 些 API 程序 可 以 初始 化 DSK、McBSP RED. 


|. 实时 分 析 。 可 以 是 严格 的 和 非 严格 的 实时 分 析 ， 例 如 : 为 了 使 信息 不 致 丢失 ， 需 要 对 输 
入 的 采样 进行 响应 ; 另 一 方面 ， 在 两 个 输入 样 点 之 间 的 间隔 时 间 内 ， 把 数据 从 数字 信号 
处 理 器 传输 到 PC 主机 中 ， 这 都 是 紧急 的 实时 分 析 。 

2. 实时 列表 。 通 过 DSP/BIOS 软件 中 断 ， 可 以 对 数据 传输 进行 调度 。 可 在 开始 就 对 任务 /功能 设 
置 不 同 的 优先 级 属性 ， 而 且 可 以 从 CPU 执行 图 中 得 到 的 结果 重新 安排 不 同 任务 的 优先 级 . 
CPU 执行 图 可 以 显示 不 同时 刻 执行 的 不 同 任务 ， 以 及 判断 CPU 是 否 丢失 实时 数据 。 该 执行 
图 和 从 逻辑 分 析 仪 中 得 到 的 图 相同 。 图 G.1 中 显示 了 一 个 音频 抽样 (包含 在 CCS 中 ) 的 执行 
图 ， 该 图 显示 了 程序 的 执行 线程 ， 一 个 线程 可 以 是 DSP 处 理 器 执行 的 独立 的 一 个 指令 流 ， 
可 以 包括 ISR 和 函数 调用 等 。 不 同类 型 的 线程 有 不 同 的 优先 级 ， 硬 件 中 断 (HWI) 有 最 高 
的 优先 级 ， 然 后 是 软件 中 断 ( SWI )， 其 中 包括 周期 函数 ( PRD )。 

3. 实时 数据 交换 ( RTDX )。 当 处 理 器 运行 时 ， 通 过 JTAG 接口 ， 主 机 和 处 理 器 之 间 可 以 进 
行 数据 交换 。RTDX 包括 目标 部 分 和 主机 部 分 ,数据 通过 两 个 管道 ( 一 个 用 来 接收 ， = 
用 来 发 送 ) 传输 。 如 果 CPU 丢失 实时 数据 ， 则 可 以 从 执行 图 中 发 现 。 如 果 可 能 的 话 ， 可 
以 通过 重新 定义 优先 级 解决 这 个 问题 。 











图 G.1 当 CPU HF NOP 过 载 时 ，CCS 画 出 的 执行 图 。 (a) 当 设 置 audioSwi 为 最 高 优先 
级 时 ， 输 出 质量 不 降低 ; (b) 当 设 置 audioSwi 为 最 低 优先 级 时 ， 输 出 质量 降低 
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$/. DSP/BIOS 的 RTDX 

在 DSK 包 中 有 一 个 音频 例子 ， 它 实质 上 是 一 个 自 环 的 例子 ， 可 用 它 来 说 明 CPU HIRR 
R., 过 载 由 执行 NOP 指令 来 达到 。 当 NOP 指令 增加 时 ， 就 可 以 观测 到 对 输出 的 影响 。 图 G.1(a) 
显示 ， 当 任务 audioSwi 是 最 高 的 优先 级 时 ， 它 可 以 中 断 较 低 优 先 级 的 任务 loadPrd。 在 图 G.1(b) 
H, audioSwi 是 一 个 较 低 优先 级 的 任务 ， 必 须 等 待 较 高 优先 级 的 任务 loadPrd 和 Prd_swi 执行 完 
了 才能 执行 ， 这 种 就 导致 数据 的 丢失 。 例 如 ， 当 用 音乐 作为 输入 时 ， 随 着 NOP 指令 的 增加 (上 
BAX), CPU 开始 丢失 数据 , 此 时 , 就 可 以 听 到 输出 信号 的 质量 下 降 , 同时 执行 图 也 显示 了 CPU 
开始 丢失 数据 。 

包含 在 CCS 中 另 一 个 例子 , 使 用 了 LOG 模块 的 LOG_prindO 函 数 来 实时 监视 程序 。 实 时 库 
支持 的 C 函数 printtiO ， 吉 要 花费 太 敌 的 指令 周期 ， 不 能 得 到 期 望 的 实时 监视 ， 而 LOG 模块 的 
LOG_printO 表 数 需要 相当 少 的 时 间 。 尽 管 目标 处 理 器 和 主机 之 间 可 能 不 是 严格 地 实时 传输 数据 ， 
但 LOG_prinf0 函 数 可 以 严格 实时 地 记录 数据 ,各 实时 库 支持 处理 器 的 printf() 函 数 相 比 ,DSP/BIOS 
支持 的 LOG_printfO 函 数 的 运行 时 间 所 需 的 指令 周期 只 有 前 者 的 1%。 

第 9 章 中 讨论 了 一 个 PLL 的 例子 ,包括 与 DSP/BIOS 的 RTDX 有 关 的 程序 版 本 ( 见 辅 助 材料 )。 
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